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Geleitwort 


Robert Thielicke 


„Künstliche Intelligenz ist eines der wichtigsten Dinge, an denen Menschen arbeiten. 
Ihre Bedeutung ist grundlegender als Elektrizität oder das Feuer”, sagte Google-Chef 
Sundar Pichai 2018 auf einer Veranstaltung in San Francisco. 


Das Wall Street Journal zitierte Microsoft-Chef Satya Nadella: „Künstliche Intelligenz 
ist nicht einfach nur eine weitere Technologie, es könnte eine der wirklich grundle- 
genden Technologien sein, die Menschen jemals entwickelt haben.” 


Sind diese Äußerungen schlichtes Marketing oder zutreffende Analyse? Es kann 
durchaus sein, dass wir in zehn oder zwanzig Jahren zurückblicken und beiden zubil- 
ligen, richtig gelegen zu haben. Momentan jedoch sind beide Sätze vor allem Ver- 
sprechungen, geäußert von Konzernlenkern, die Geld verdienen möchten. 


Und trotzdem taucht insbesondere Pichais Behauptung in vielen Artikeln und Vorträ- 
gen über das Potenzial der Künstlichen Intelligenz auf. Dort dient sie als Hinweis auf 
die umwälzenden Wirkungen, die uns erwarten. Beim Thema „Künstliche Intelli- 
genz” nimmt man Marketing allzu oft für bare Münze. 


Warum? Es wäre eine zu einfache Antwort, lediglich technisches Unwissen anzufüh- 
ren. Die Ursache reicht tiefer. Sie findet sich in unserer Sicht auf diese neue Entwick- 
lung. Europäer und gerade Deutsche sehen Künstliche Intelligenz kritisch, in der brei- 
ten Wahrnehmung überragen die Nachteile die Vorteile. Gefürchteter Verlust von 
Job und Entscheidungsfreiheit wiegen schwerer als bessere Entscheidungen in der 
Medizin oder weniger Todesfälle im Straßenverkehr. Wenn also Sundar Pichai oder 
Satya Nadella die Macht einer Entwicklung beschwören, die viele eher fürchten - 
sollte man ihnen dann nicht glauben? Würden beide eine unheimliche Zukunft an 
die Wand malen, wenn es ihnen nicht ernst wäre? 


Es ist höchste Zeit, Werbung und Wirklichkeit zu trennen. Sich dem Thema mit einer 
gewissen Distanz zu nähern, sich genau anzuschauen, welche Möglichkeiten die 
Künstliche Intelligenz bietet, wo ihre Grenzen liegen - und wo die wirklichen Gefah- 
ren lauern. Es ist richtig, dass die Entwicklung an niemandem spurlos vorübergehen 
wird. Aber wie tief werden diese Spuren? Wer sie jenseits des Hypes vermisst, 
bekommt ein gutes Gefühl dafür, was tatsächlich auf Gesellschaft und Wirtschaft 
zukommt. Und sieht klarer, wie beide sich vorbereiten können. 
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Wie jede Technologie ist auch die Künstliche Intelligenz kein unausweichliches 
Schicksal. Sie lässt sich gestalten. Umgekehrt bedeutet dies aber auch: Wenn wir sie 
nicht mitgestalten, tun es andere für uns. Die große Frage lautet daher: Wie soll diese 
Zukunft aussehen? Wohin wollen wir mit lernenden Maschinen und denkenden 
Robotern? Ich hoffe, dieser Band hilft dabei, die richtigen Antworten zu finden. 


Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 International Lizenz 
http:/creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche die Nutzung, 
Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und 
Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß 
nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen 
vorgenommen wurden. 


Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der 
genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes 
ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz 
steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für 
die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen 
Rechteinhabers einzuholen. 
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Vorwort 


Volker Wittpahl 


Vielen Menschen scheinen die Debatten über Künstliche Intelligenz (KI) vom Alltag 
noch weit entfernt, doch als Internetnutzerin oder Internetnutzer ist man täglich mit 
ihr - meist unbewusst - schon konfrontiert: sei es hinter der Auswahl von Werbung, 
welche beim Surfen auf Internetseiten auf die individuellen Präferenzen und das 
Nutzerverhalten der Surfer abgestimmt ist, die Kaufempfehlungen beim Online-Shop 
von Amazon, die Chatbots, welche auf Webseiten die oft gestellten Fragen (engl. 
Frequently Asked Questions, FAQ) als Dialogassistenz beantworten oder die Sprach- 
steuerungen Siri und Alexa, welche auf Smartphones oder als Smart Speaker im Haus 
auf Spracheingabe reagieren. 


Wenn man in der Fachpresse und in den Medien die Entwicklungen der KI-Technolo- 
gie aufmerksam verfolgt und beobachtet, kann man feststellen, dass immer häufiger 
von Erfolgen der Kl berichtet wird. Diese lassen nicht nur Laien, sondern auch Exper- 
tinnen und Experten oft ein staunend überraschendes bis ängstliches „Oh mein 
Gott!” ausrufen. Hier nur einige Beispiele: 


Auf den ersten Blick harmlos und doch spektakulär sind die Entwicklungen im Bereich 
der Spiele. So schlug schon im Jahr 1996 der Computer „Deep Blue” von IBM den 
damaligen Schachweltmeister Garri Kasparow (Neander 1996). Im Oktober 2015 
wurde der Europameister des japanischen Brettspiels „Go”, Fan Hui, von der Kl 
AlphaGo aus der Kl-Schmiede DeepMind von Google geschlagen. Im März 2016 
wurde dann auch der internationale Champion Lee Sedol von AlphaGo geschlagen 
(Lossau 2017). Im Jahr 2017 stellte DeepMind den Nachfolger AlphaGo Zero vor, ein 
KI-System, das ohne vorab gespeichertes Expertenwissen auskommt. AlphaGo Zero 
kannte nur die Spielregeln, mit denen es die Go-Steine auf dem Brett setzen und 
bewegen kann, und nutzte verstärktes Lernen (Reinforcement Learning, siehe Einlei- 
tungskapitel Teil A Technologie „Entwicklungswege zur KI”). Während des Trainings 
benötigte AlphaGo Zero durchschnittlich 0,4 Sekunden Denkzeit pro Zug. In nur drei 
Tagen war AlphaGo Zero der beste Go-Spieler aller Zeiten. Selbst den im Vorjahr 
noch gefeierten AlphaGo schlug AlphaGo Zero in einer ersten Spielserie mit schlap- 
pen 100 zu 0. Die Leistung ist umso erstaunlicher, als Alpha Go Zero mit einer spar- 
sameren Hardware auskommt als sein Vorgänger und nur 3,9 Millionen statt 30 
Millionen Trainingsspiele benötigte (Weber 2017). 
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Neben klassischen Brettspielen wurden auch Video- und Computerspiele genutzt, 
um die Leistungsfähigkeit von KlI-Systemen aufzuzeigen. So war im Jahr 2015 die KI 
von DeepMind imstande, 49 verschiedene Atari-Spiele für die Atari-2600-Konsole 
wie „Breakout”, „Video Pinball” und „Space Invaders” erfolgreich zu bewältigen. Im 
Test schaffte es die KI, sich die Regeln der Atari-Spiele selbst beizubringen (Spiegel 
Online 2015). Für das Spiel „Breakout” entdeckte sie sogar eine optimale Strategie. 
Insgesamt gelang es dem KI-System, Menschen in 29 der 49 unterschiedlichen Spiele 
zu schlagen (Tegmark 2017). 


Im Jahr 2018 gelang es einer weiteren Kl, den Atari-Klassiker Q*bert zu spielen - sie 
erreichte dank eines Bugs „unmögliche“ (Wittenhorst 2018) Highscores. Forschende 
hatten evolutionäre Algorithmen auf die Atari-Spieleklassiker losgelassen, um zu 
untersuchen, wie sie sich gegen das etablierte Reinforcement Learning schlagen. 
Dabei fand die KI im Hüpfspiel Q*bert einen „Bug“ und trickste ungeplant das 
Gamedesign aus. Das Jahr 2018 bot aber noch weitere „spielende” Erfolge von 
selbstlernender Kl: In dem komplexem Computerspiel Dota 2, einem Multiplayer- 
Online-Battle-Arena-Game, hat ein Team aus fünf kollaborativen KI-Systemen eine 
Gruppe von Menschen im Teamwork geschlagen (Knight 2018). Eine weitere KI 
brachte sich selbst mittels tiefem Lernen (Deep Learning, DL) bei, wie man den Zau- 
berwürfel (Rubik’s Cube) löst. Die theoretisch kleinste Anzahl der Schritte, die not- 
wendig sind, um den Würfel aus einer zufälligen Position zu lösen, ist 26. Die KI kann 
jeden zufällig eingestellten Würfel zu 100 Prozent lösen und erreicht dabei eine mitt- 
lere Schrittzahl von 30. Das ist genauso viel wie oder weniger als Menschen erreichen 
(TR online 2018). 


Kl-Sprachassistenten sind auf dem Vormarsch, seit 2011 Siri in das Betriebssystem 
von iPhones integriert wurde: Siri steht inzwischen 700 Millionen Nutzerinnen und 
Nutzern von iPhones zur Verfügung, 400 Millionen Menschen können mit dem 
Google Assistant sprechen, weitere 400 Millionen mit Microsofts Assistent Cortana. 
Zu diesen gesellen sich seit der Markteinführung von Alexa durch Amazon im Jahr 
2015 auch noch Millionen von Smart Speakern, die als Assistenten zu Mitgliedern 
des Haushalts werden (Boeing 2018). 


Um die Akzeptanz Kl-gestützter Assistenzsysteme zu steigern, müssen die Sprachas- 
sistenzen wie echte Menschen klingen. Googles aktuelle synthetische Sprachaus- 
gabe ist klanglich kaum mehr als Roboterstimme zu erkennen. Die Kl hat eine verbes- 
serte Intonation für einen natürlicheren Sprachfluss. Sie berücksichtigt bei der Beto- 
nung den Schreibstil und die Position von Wörtern im Satz. Wenn ein Fragezeichen 
am Satzende steht, geht die Stimme nach oben. Emotionen im Klang sowie Sprach- 
ausgabe in Echtzeit sind jedoch noch nicht möglich (Bastian 2018a). 


Ergänzend zu dem Einsatz der Sprachassistenzen entwickelt sich derzeit das Klonen 
von Stimmen und Gesichtern. So ist das chinesische Unternehmen Baidu mit seiner 
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Kl-Anwendung „Deep Voice” in der Lage, anhand von wenigen Sekunden Aus- 
gangsmaterial eine Stimme zu klonen. Dass ein System so schnell arbeitet, ist schon 
besonders, wenn man bedenkt, dass im Jahr 2017 noch 30 Minuten Trainingsmate- 
rial benötigt wurden und Adobe im Jahr 2016 ein Stimmklonverfahren vorgestellt 
hat, das 20 Minuten benötigte. Mit der Kl-Klonstimme von Baidu lässt sich mittels 
Text-zu-Sprache-Software jede Aussage mit der Intonation und in der Stimmlage des 
Originalsprechers wiedergeben, unabhängig vom Inhalt der Aussage, mit der sie trai- 
niert wurde (Bastian 2018b). 


Nicht nur Stimmen lassen sich mittels KI klonen, sondern auch Personen in Filmen. Im 
Frühjahr 2018 stellten Forschende auf der Siggraph „Deep Video Portrait” vor. „Deep 
Video Portrait” ist eine Methode zur Video-Manipulation mittels DL-Verfahren. 
Anders als bei existierender kostenfreier Software’ zur Videomanipulation wird die 
Mimik samt Kopfbewegungen von einer Person auf das Gesicht einer zweiten Person 
in einem Video projiziert. Kopfbewegungen in drei Dimensionen, Kopfdrehung, den 
Gesichtsausdruck, die Blickrichtung und Blinzler erkennt das KlI-System und kann 
sogar den Schatten, den der Kopf auf den Hintergrund wirft, im Nachhinein perspek- 
tivisch korrekt in das Video rechnen (Kim et al. 2018). 


Kl-Systeme unterstützen nicht nur Sprachassistenten oder klonen Stimmen und 
Gesichter, inzwischen sind sie auch in der Lage, eigenständig mit Menschen zu kom- 
munizieren. So zeigte Google mit seinem Duplex-System, wie ein Kl-System als 
Kunde am Telefon einen Friseurtermin bucht und einen Tisch im Restaurant reser- 
viert. Bei der natürlich erscheinenden Stimme am Telefon hätte man keine KI vermu- 
tet. Anders als die klassischen Roboterstimmen fügt Google Duplex Unregelmäßig- 
keiten in die Sätze ein. So sind scheinbare Denkpausen zu hören oder ein hin und 
wieder gemurmeltes „Mhmm” und unvermittelt auftretende Sprechpausen. Hier- 
durch ergibt sich das Gefühl, die KI geht auf Gesprächspartner ein oder denkt nach 
(Kremp 2018). Duplex soll ab 2018 zunächst testweise in den Google Assistant inte- 
griert werden (Herbig 2018). Ebenfalls Kl-basiert eruiert Googles E-Mail-Dienst Gmail 
mit der „Smart Compose”-Funktion, was die Nutzenden sagen wollen (Schwan 
2018a). 


Eine ganz andere Dimension der Kl-Anwendung in der Kommunikation ist der 2016 
vorgestellte Smart Speaker MOODBOX. Die MOODBOX besitzt eine KI zur Emotions- 
erkennung. Der Smart Speaker prüft, wie sich der Besitzer fühlt und spielt Musik 
passend zur Gefühlslage (Gineers Now 2018). 


1 z. B. FakeApp, https://www.chip.de/news/FakeApp-kostenlos-Software-tauscht-Personen- 
in-Videos_133462513.html, zuletzt geprüft am 22.07.2018. 
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Kl-Anwendungen werden längst nicht mehr nur für die zwischenmenschliche Kom- 
munikation optimiert. So ist der Podcast „Sheldon County” komplett von einem KI- 
System geschrieben und eingesprochen. Die Sprecherin Justine mit ihrer jungen Frau- 
enstimme ist eine realistisch klingende Sprachsoftware, die man sich von Amazons 
Webdienstetochter AWS mieten kann. Mittlerweise gibt es mehrere Folgen, die von 
der Kl entworfen und eingesprochen wurden (Schwan 20186). 


KI ist zu einem Thema geworden, das viele Menschen ähnlich wie Digitalisierung 
nicht vollständig greifen und einschätzen können. Der zunehmende Einsatz von Kl in 
unterschiedlichen Lebens- und Wirtschaftsbereichen kommt - aber wie werden wir 
damit umgehen? Im privaten Umfeld verdrängt der gefühlte Komfort das Unbeha- 
gen gegenüber der Nutzung von Kl-Systemen. Jedoch ist der Einsatz von KI im 
Arbeits- und Wirtschaftsumfeld schon etwas, das erhebliche Veränderungen inner- 
halb kürzester Zeit mit sich bringen kann, was wiederum eine große Verunsicherung 
bei vielen Menschen in Bezug auf ihre Arbeit auslöst. Die aufgeführten Beispiele 
zeigen die rasante Geschwindigkeit in der Kl-Entwicklung. Die damit einhergehen- 
den Veränderungen machen eine gesellschaftliche Diskussion zum Einsatz der KI- 
Nutzung immer dringlicher. 


Aktuelle Publikationen zeigen die Notwendigkeit einer faktenbasierten Technologie- 
folgenabschätzung sehr deutlich. So hat Yvonne Hofstetter im Jahr 2016 noch vor 
den Wahlen in den USA in ihrem Buch „Das Ende der Demokratie - Wie die künstli- 
che Intelligenz die Politik übernimmt und uns entmündigt” (Hofstetter 2016) aufge- 
zeigt, wie sich mittels KI Massen manipulieren lassen und durch ihren Einsatz unsere 
Demokratie bedroht wird. 


Der MIT-Professor Mark Tegmark hat dann in seinem Buch „Leben 3.0 - Mensch sein 
im Zeitalter der künstlichen Intelligenz“ (Tegmark 2017) einen allgemeinen Überblick 
zur Geschichte der Kl-Entwicklung sowie zu aktuellen und möglichen Anwendungs- 
feldern gegeben. Diese sind zum Beispiel der Einsatz im Finanzwesen, in der Ferti- 
gung, im Transportwesen, im Energiesektor, im Gesundheitswesen oder bei der 
Erforschung des Weltraums. Aber auch der Einsatz von KlI-Systemen als Richter oder 
in autonomen Waffen wird diskutiert. Tegmark zeigt im Buch auch mögliche Szena- 
rien für den Punkt auf, dass eine Allgemeine Künstliche Intelligenz (AKI) auf mensch- 
lichem Niveau geschaffen wird und sogar über dieses hinaus wächst. Das von Teg- 
mark mitbegründete „Future of Life Institute” hat sich dem Ziel gewidmet, existen- 
zielle Risiken für die Menschheit zu verringern, die durch transformative Technologien 
wie die KI hervorgerufen werden. Dem Beirat gehören unter anderem der Unterneh- 
mer Elon Musk, der Kl-Forscher Stuart Russel und der 2018 verstorbene Physiker 
Stephen Hawking an. 


Wie weit bereits die KI in unseren Alltag und Bereiche menschlicher Kultur vorge- 
drungen ist, hat Holger Volland nun in „Die kreative Macht der Maschinen - Warum 
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Künstliche Intelligenzen bestimmen, was wir morgen fühlen und denken” (Volland 
2018) sehr anschaulich an verschiedenen Aspekten wie Sprache, Bilder, Kreativität 
und Emotionen aufgezeigt. 


Was alle drei Bücher zur KI gemein haben, ist die Warnung vor anstehenden tiefgrei- 
fenden und unumkehrbaren Veränderungen sowie die Aufforderung, hierfür gestal- 
terische Verantwortung zu übernehmen. 


Mit dem vorliegenden iit-Themenband „Künstliche Intelligenz“ wird den Leserinnen 
und Lesern für den gesellschaftlichen Diskurs Wissen zum Einsatz von KI bereitge- 
stellt. Die Beiträge in den Teilen A „Technologie“ und B „Anwendung“ zeigen 
schlaglichtartig das Potenzial vom Kl-Einsatz auch jenseits des Offensichtlichen auf. 
Dabei liegt der Fokus mehr auf den Voraussetzungen zur Nutzung und Anwendung, 
wie z. B. die Datenverfügbarkeit, Infrastruktur oder Akzeptanz. Die Beiträge im 
abschließenden Teil C „Gesellschaft" zeigen die Breite der gesellschaftlichen Diskurse 
zur Kl auf und mögen anregen, diese Diskurse auf das eigene Umfeld zu übertragen 
und im jeweiligen Kontext fortzuführen. 


Berlin, Deutschland Prof. Dr. Volker Wittpahl 
Juli 2018 Geschäftsführender Direktor 
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Einleitung: Entwicklungswege zur Kl 
Moritz Kirste, Markus Schürholz 


Wir nennen uns selbst Homo sapiens — der weise Mensch. Erste Versuche, 
diese Weisheit zu beschreiben, zu verstehen, abzubilden und in Gesetzmäßig- 
keiten zu verwandeln, reichen bis in die Antike zurück und haben eine lange 
Tradition in der Philosophie, Mathematik, Psychologie, Neurowissenschaft und 
Informatik. Vielfach wurde versucht, den Begriff der Intelligenz - also die kog- 
nitive Leistungsfähigkeit des Menschen - besser zu verstehen und zu definie- 
ren. Als Kl bezeichnet man traditionell ein Teilgebiet der Informatik, das sich 
mit der Automatisierung von intelligentem Verhalten befasst. Eine genaue 
Begriffsbestimmung ist jedoch kaum möglich, da auch alle direkt verwandten 
Wissenschaften wie Psychologie, Biologie, Kognitionswissenschaft, Neurowis- 
senschaft an einer genauen Definition von Intelligenz scheitern. 


Die Versuche, Intelligenz zu beschreiben und nachzubilden, lassen sich grob in vier 
Ansätze unterteilen, die sich mit menschlichem Denken, menschlichem Handeln, 
rationalem Denken und rationalem Handeln befassen (Russell et al. 2010). So gehört 
beispielsweise der berühmte Turing-Test (TURING 1950) in den Bereich menschliches 
Handeln, da bei diesem eine KI menschliches Handeln perfekt reproduziert, während 
moderne Programme zur Bilderkennung und damit verbundenen Entscheidungen 
eher im Bereich des rationalen Handelns verortet werden können. Neben den defini- 
torischen Schwierigkeiten befasst sich ein Teil dieser philosophischen Debatte zur KI 
mit den Unterschieden und Konsequenzen zwischen erstens einer schwachen oder 
eingeschränkten KI (weak or narrow Al), welche spezielle Probleme intelligent lösen 
kann, zweitens einer starken oder generellen KI (strong/general Al), welche allge- 
meine Probleme ebenso gut wie Menschen lösen kann und drittens einer künstlichen 
Superintelligenz, welche die menschlichen Fähigkeiten weit übertrifft (Kurzweil 
2001, Bostrom 2014). 


Trotz dieser Vielzahl von Ansätzen und Definitionen lässt sich jedoch ein zentraler 
Aspekt benennen, den alle als KI bezeichnete Systeme aufweisen: Es ist der Versuch, 
ein System zu entwickeln, das eigenständig komplexe Probleme bearbeiten kann. Es 
gibt viele Möglichkeiten, das sehr heterogene Forschungsgebiet der KI und seiner 
vielen Unterkategorien zu beschreiben. Manche Ansätze befassen sich mit den Prob- 
lemen, die auf dem Weg zur Intelligenz von Computersystemen auftreten, andere 
mit den Lösungsansätzen für diese Probleme und wiederum andere mit den Verglei- 
chen zur menschlichen Intelligenz. Um die vielen Teilgebiete soll es hier nicht im 
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Künstliche Intelligenz (KI) 


Erste Anwendungen sorgen für Begeisterung. 


Maschinelles Lernen (ML) 
ML entwickelt sich. 


Dmmmmmm ) ) ) ı 


Abbildung A.1: Methoden der KI (eigene Darstellung in Anlehnung an Copeland 2016) 


Einzelnen gehen.? Vielmehr sollen die wichtigsten Grundlagen der KI ohne den 
Anspruch auf Vollständigkeit erläutert werden (Abbildung A.1). 


Die Anfänge 


Am Anfang befasste sich die Entwicklung der KI häufig mit Spielen und mathemati- 
schen Repräsentationssystemen von Wissen und Entscheidungen, während seit dem 
Ende des 20. Jahrhunderts die Technik des maschinellen Lernens (Machine Learning, 


2 Ausführliche Darstellungen zu Teilgebieten wie Verarbeitung natürlicher Sprache, 
Wissensrepräsentation, automatisches logisches Schließen, Planung und Wahrnehmung, 
Robotik und viele mehr finden sich in Russell et al. (2010) und Luger (2003). 
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ML) und in jüngster Zeit das tiefe Lernen (Deep Learning, DL) große Erfolge verzeich- 
nen konnten und letztlich das aktuell starke Interesse an Kl verursachen. 


Erste Ansätze der Kl orientierten sich an klassischen Prinzipien der mathematischen 
Logik. In der Aussagenlogik können einfache logische Verknüpfungen wie UND, 
ODER, NICHT kombiniert und Aussagen mit einem Wahrheitsgehalt (WAHR, FALSCH) 
belegt werden, während in der Prädikatenlogik Argumente formuliert und auf ihren 
Wahrheitsgehalt überprüft werden können. Die ersten Systeme der KI waren logi- 
sche Repräsentationssysteme, mit deren Hilfe sich einfache Schlussfolgerungen wie 
Aussage 1: „Die erste Konferenz zu KI fand 1956 am Dartmouth College statt”, 
Aussage 2: „Claude Shannon hat an der ersten Konferenz zu Kl teilgenommen” und 
Schlussfolgerung: „Claude Shannon war 1956 am Dartmouth College” nachvollzie- 
hen und beweisen lassen. Kl-Systeme, die auf Logik basieren, werden natürlich für 
deutlich komplexere mathematische Beweise und Theoreme eingesetzt und werden 
mit Hilfe logischer Programmiersprachen wie PROLOG (Colmerauer und Roussel 
1996) bis heute in modernen Kl-Anwendungen wie WATSON von IBM genutzt (Lally 
und Fodor Paul 2011). 


Ein beliebtes Anwendungsgebiet der KI war und ist das Gebiet der menschlichen 
Spiele (Samuel 1959). Dieser Ansatz ist naheliegend, denn die Fähigkeiten der KI las- 
sen sich gut und vergleichbar daran messen, wie gut sie gegen den Menschen spielen 
oder diesen übertreffen. Der Vorteil dieser Spiele als Messlatte besteht in ihrem übli- 
cherweise einfachen Regelsystem und einfach beschreibbaren Handlungsmöglichkei- 
ten bei gleichzeitig, je nach Spiel, fast unbegrenzten Variationen. Schach beispiels- 
weise hat sehr einfache Regeln, aber geschätzte 10! Zugmöglichkeiten. Diese sehr 
große Zahl liegt außerhalb der menschlichen Vorstellungskraft und es ist bei einer 
derart hohen Anzahl zunächst unmöglich, dass ein Programm alle Möglichkeiten 
durchrechnet, um daraus die perfekte Spielstrategie zu entwickeln. Diese hohe Anzahl 
von Zugmöglichkeiten entsteht dadurch, dass jede Entscheidung, das heißt jeder 
mögliche Zug im Schach, wieder neue Entscheidungsalternativen und neue Züge, 
aber mit jeweils anderen Ausgangssituationen und immer so weiter hervorruft. Diese 
Entscheidungsvarianten können als Baum oder sogenannter Graph beschrieben wer- 
den, bei dem jedes Blatt beziehungsweise Knoten eine Möglichkeit - im Spiel ist das 
ein Spielzug - darstellt, aus der sich dann immer neue und andere bis ins Unendliche 
ergeben. So wie ein Baum wächst, so entfalten sich die möglichen Spielzüge in immer 
wieder neue Verzweigungen und Verästelungen bis ins quasi Unendliche aller mögli- 
chen Spielzüge. Einen solchen Baum nennt man Entscheidungsbaum (Decision Tree), 
und ganze Bereiche der Mathematik und Informatik beschäftigen sich mit der mög- 
lichst effizienten Suche in solchen verzweigten Graphen. 


Eine sehr effektive Möglichkeit der Suche in Entscheidungsbäumen sind sogenannte 
Heuristiken. Eine Heuristik ist ein Verfahren, das innerhalb eines solchen zu durchsu- 
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chenden Graphen für jeden Punkt immer wieder die Sinnhaftigkeit einer weiteren 
vertieften Suche bestimmt und auf diese Weise verhindert, dass nach der besten 
Strategie lange - im schlimmsten Falle unendlich lange - gesucht wird. Beim Schach 
bedeutet dies, dass die möglichen Züge nach bestimmten Kriterien bewertet werden 
und die Möglichkeiten, die sich aus offensichtlich schlechten Zügen ergeben, nicht 
mehr weiter in Betracht kommen. Demnach führt die Heuristik dazu, dass ein Ent- 
scheidungsbaum ganz gezielt durchsucht wird, bis ein zufriedenstellendes Ergebnis 
herauskommt, das nicht unbedingt das bestmögliche Resultat sein muss. Entschei- 
dungsbäume und die damit verbunden Heuristiken sind in der KI ein sehr effektives 
Verfahren für Problemstellungen, die durch ein klares und unveränderliches Regelsys- 
tem beschrieben werden können. 


Auf die ersten Erfolge der KI im Bereich der Logik und Spiele folgten Versuche, die 
Verfahren auf allgemeinere Anwendungsfälle zu erweitern. In den 1970er Jahren 
entstanden Expertensysteme, die über Wenn-Dann-Beziehungen probieren, eine 
menschliche Wissensbasis in für Computer lesbare Informationen zu verwandeln. 
Mit den Möglichkeiten zu logischen Schlussfolgerungen und dem effektiven Suchen 
in diesen Wissensbasen mit Hilfe von Heuristiken konnten die Systeme zunächst 
einige Erfolge aufweisen und weckten in den 1980er Jahren große Erwartungen an 
die Möglichkeiten der KI. Ein wesentlicher Nachteil dieser Systeme ist jedoch der 
immense Aufwand bei der Erfassung menschlichen Wissens und der Umwandlung in 
die für das Expertensystem notwendige Wissensbasis. Anfang der 1990er Jahre wur- 
den die großen Erwartungen an die KI enttäuscht: Viele Firmen, die zuvor für viel 
Geld Expertensysteme gekauft hatten, schafften diese wieder ab. Eine große Anzahl 
von Unternehmen, die solche Systeme angeboten hatten, verschwanden vom Markt. 
Diese Misserfolge führten gemeinsam mit einer signifikanten Reduktion von For- 
schungsgeldern im Bereich der KI ab Ende der 1970er Jahre zur ersten und zweiten 
Phase des sogenannten Al Winters (Crevier 1995). 


Maschinelles Lernen 


Trotz der genannten Rückschläge für die Forschung wurden in den 1980er Jahren die 
Grundlagen für den heute so zentralen Ansatz des ML gelegt. Die Grundidee ist ein- 
fach: Wie bringt man ein Computerprogramm, das eine bestimmte Aufgabe hat, 
dazu, aus Erfahrungen zu lernen und mit diesen Erfahrungen die Aufgabe in Zukunft 
besser zu erfüllen (Mitchell 2010)? Der Unterschied zu einem statischen Programm 
liegt darin, dass sich die Entscheidungsregeln über eine Rückkoppelung an das 
Erlernte anpassen (Abbildung A.2). ML unterteilt sich in die drei Hauptkategorien 
überwachtes Lernen (Supervised Machine Learning), unüberwachtes Lernen (Unsu- 
pervised Machine Learning) und verstärktes Lernen (Reinforcement Machine Lear- 
ning), auf die im Folgenden näher eingegangen werden soll. Zusätzlich unterscheidet 
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Traditionelle Maschinelles 
Programme Lernen (ML) 


Statischer 
Code 


FEEDBACK 


Hypothese 


Abbildung A.2: Traditionelle Programme versus ML 


man zwischen Offline- und Online-Lernsystemen. Bei dem ersten System findet das 
Lernen von Verhalten zunächst offline, also getrennt vom Anwendungsszenario, 
statt. Erst dann wird das Gelernte angewendet und nicht mehr verändert. Die Online- 
Lernsysteme hingegen lernen und verändern ihr Verhalten stets innerhalb des 
Anwendungsszenarios und passen sich beständig an. 


Beim überwachten Lernen (Supervised Machine Learning) bekommt ein Computer- 
programm bekannte Beispieldaten und wird auf eine gewünschte Interpretation und 
die damit verbundene Ausgabe trainiert. Das Ziel ist es, generelle Regeln zu finden, 
welche die bekannten Eingabedaten mit den gewünschten Ausgabedaten verbin- 
den, und im Anschluss diese Regeln zu verwenden, um mit neuen Eingabedaten 
neue Ausgaben zu erstellen. In diesem Sinne hat das Computerprogramm etwas 
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gelernt, und mit diesem gelernten Wissen lassen sich dann Vorhersagen über künf- 
tige und bisher unbekannte Eingabe- und Ausgabedaten treffen. Es entsteht also 
eine Art eigenständiges Verhalten des Computerprogramms. Das einfachste Verfah- 
ren einer solchen Modellbildung ist das der Regression, welches sich an folgendem 
Beispiel erläutern lässt. Zwischen der Körpergröße und der Schuhgröße eines Men- 
schen gibt es den einfachen linearen Zusammenhang: je größer der Mensch, desto 
größer auch der passende Schuh. Dieser Zusammenhang lässt sich als lineare Funk- 
tion darstellen, mit einer unabhängigen Eingangsvariable (Körpergröße) und einer 
abhängigen Ausgangsvariable (Schuhgröße). Durch das mathematische Verfahren 
der Regression werden nun die Parameter der Funktion ermittelt, und man erhält ein 
Modell, mit dem sich Schuhgrößen aus Körpergrößen vorhersagen lassen (siehe 
Abbildung A.3). 


Ein zweites wichtiges Verfahren des überwachten Lernens ist das der Klassifikation. 
Dabei werden während des Lernprozesses jeweils mehrere Werte voneinander als 
Klassen unterschieden und bei der späteren Vorhersage einzelne Werte einer 
bestimmten Klasse zugeordnet. Beispielsweise könnte man mittels Klassifikation 
linke und rechte Füße unterscheiden, indem man alle Richtungen eines Fußes genau 
vermisst (Abbildung A.3). Oder man könnte ein einfaches Modell zur Kreditwürdig- 
keit erstellen, das auf den beiden Eingabewerten Einkommen und Ersparnisse beruht. 
Personen unterhalb einer bestimmten Einkommens- und Ersparnisgrenze wären 
demnach in der einen Klasse, nämlich der nicht kreditwürdigen, und oberhalb einer 
solchen Grenze in der anderen Klasse, der kreditwürdigen. Der Vorteil der Klassifika- 
tion besteht darin, dass immer aufgrund des Zusammenspiels mehrerer Werte beur- 
teilt wird. Demzufolge würde eine Person mit zwar niedrigen Ersparnissen, dafür 
aber hohem Einkommen in der Klasse kreditwürdig eingeordnet werden. 


Sowohl Regression als auch Klassifikation sind Vorhersagemodelle, die Aussagen 
über die Zukunft treffen können. Sie werden sehr effektiv beispielsweise im Bereich 
der Preisentwicklung, vorausschauenden Instandhaltung und Bilderkennung einge- 
setzt. Der Unterschied liegt in der Anwendung: Die Regression erlaubt Vorhersagen 
über stetige Werte, beispielsweise die Einkommensentwicklung einer Person, wäh- 
rend bei der Klassifikation Klassen unterschieden werden, beispielsweise die Kredit- 
würdigkeit. 


Unüberwachtes Lernen (Unsupervised Machine Learning) funktioniert ohne vorher 
bekannte Zuordnung und Kennzeichnung von Eingabedaten. Die möglichen Ergeb- 
nisse sind dabei gänzlich offen. Deshalb kann das Computerprogramm auch nicht 
trainiert werden, sondern muss vielmehr in den Daten Strukturen erkennen und 
diese in interpretierbare Informationen verwandeln. Ein anschauliches Verfahren des 
unüberwachten Lernens ist das Clustering, welches der zuvor beschriebenen Klassi- 
fikation ähnelt, mit dem Unterschied, dass beim Clustering die Klassifikationsklassen 
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Lineare Klassifikation Nicht-Lineare Klassifikation 


Abbildung A.3: Bei der linearen Regression (oben links) wird zwischen einer Eingangsvariable 
x (hier die Körpergröße) und einer Ausgangsvariable y (hier die Schuhgröße) ein linearer 
Zusammenhang hergestellt. Mit dem Modell lassen sich im Anschluss bisher noch unbe- 
kannte Werte vorhersagen. Dasselbe ist auch für einen komplizierteren nicht-linearen 
Zusammenhang möglich (oben rechts). Bei der Klassifikation (unten) werden die Eingangsva- 
riablen für eine Unterteilung in verschiedene Klassen genutzt. In diesem Beispiel wird anhand 
von zwei Eingabewerten (x1 und x2) unterschieden, ob es sich um linke (grau) oder rechte 
(rot) Füße handelt. Auch bei der Klassifikation gibt es lineare (links) und nicht-lineare 
Verfahren (rechts). 
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Daten 


Bearbeitung durch Algorithmus 
(z.B. k-means) 


Daten-Modell 


Abbildung A.4: Beim Clustering werden Eingabedaten durch Algorithmen (wie z. B. der 
bekannte k-means-Algorithmus) in Gruppen zusammengefasst. Alle Mitglieder dieser 
Gruppen haben ähnliche Merkmale - hier sind es Hände, Füße oder Münder. Auf diese 


Weise entsteht eine geordnete Struktur in den Daten und das zugehörige Modell kann für 
eine Interpretation genutzt werden. 
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erst dadurch entstehen, dass Ähnlichkeiten in den Daten erkannt und zu Gruppen 
zusammengefasst werden (Abbildung A.4). Weitere weniger anschauliche Verfahren 
sind Dimensionsreduktion und Hauptkomponentenanalyse sowie Dichteermittlung. 
Methoden des unüberwachten Lernens kommen in vielen alltäglichen Anwendun- 
gen zum Einsatz. So können Kaufverhalten und Nutzerverhalten im Onlinehandel 
vorhergesagt sowie Empfehlungssysteme beispielsweise für Filme erstellt werden 
(Netflix Prize o. J.). 


Beim verstärkten Lernen (Reinforcement Machine Learning), der dritten Kategorie 
des ML, lernt ein Computerprogramm direkt aus den Erfahrungen. Hierzu interagiert 
es mit seiner Umgebung und erhält für richtige Ergebnisse eine Belohnung. Das Pro- 
gramm ist mit einem dressierten Tier zu vergleichen, indem es beispielsweise in einer 
Spielsituation dafür belohnt wird, wenn es das Spiel gewinnt. Das Ziel ist nun, dass 
das Programm sich die Konsequenzen seiner Handlung merkt und mit diesem Wis- 
sen versucht, seine Belohnung zu maximieren. Die Belohnung ist dementsprechend 
die Regelgröße, die in diesem Verfahren optimiert wird. Das zurzeit recht bekannte 
Beispiel für den Einsatz von verstärktem Lernen ist AlphaGo Zero, die Weiterentwick- 
lung von AlphaGo.? AlphaGo Zero erlernte das Spiel Go mittels verstärktem Lernen 
ohne vorherige Kenntnis über das Spiel in nur drei Tagen so gut, dass es besser spielte 
als seine Vorgängerversion und weitaus besser als die weltbesten menschlichen Spie- 
ler (Silver et al. 2017). Verstärktes Lernen könnte sich in den nächsten Jahren als eine 
wichtige Technologie in der Automatisierung und insbesondere der Robotik erweisen 
(Kober et al. 2013). So erlernten etwa die Roboterarme der Firma Fanuc mittels ver- 
stärkten Lernens binnen weniger Stunden, ihnen bislang unbekannte Objekte sicher 
zu greifen und zu bewegen (Knight 2016). 


Tiefes Lernen 


Im Laufe der Zeit wurden unterschiedliche Ansätze, Methoden und (Software-)Tech- 
nologien unter dem Namen KI entwickelt. Sie werden weiterhin erforscht und adap- 
tiert. Der aktuelle KI-Boom beruht im Wesentlichen auf dem tiefen Lernen mit künst- 
lichen neuronalen Netzen (KNN). So nennt man das Lernen mit Algorithmen, die 
Netzstrukturen von Nervenzellen nachbilden. „Tief“ bedeutet in diesem Zusammen- 
hang unabhängig von der genauen Netzstruktur, dass diese einige bis viele Schichten 
tief ist. Wie auch im Begriff KI schwingt im alltäglichen Wortgebrauch ein gewisser 
Hauch von „tiefem Verständnis” abstrakter Zusammenhänge mit. Obwohl sich das 
tiefe Lernen in Grundzügen an der Funktionsweise biologischer neuronaler Netze 


3? AlphaGo ist das Programm der Firma Google Deep Mind, das die weltbesten Go-Spieler 
im März 2016 mühelos schlagen konnte. 
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orientiert und viele Medien verkürzt nur von neuronalen Netzen sprechen, gibt es 
deutliche Unterschiede zum biologischen Vorbild. 


Die Neurowissenschaft hat mittlerweile ein gutes Verständnis dafür entwickelt, wie 
ein einzelnes biologisches Neuron, z. B. eine Gehirnzelle, Information weiterverarbei- 
tet. Dabei geben vorgeschaltete Neuronen elektrische Impulse über chemische 
Potenziale an ihren Synapsen an ein Neuron weiter. Das Neuron erhält im Zeitverlauf 
zahlreiche solcher Impulse und lädt sich dabei auf, bis ein Schwellenpotenzial erreicht 
ist. Dann feuert das Neuron einen eigenen Impuls über sein Axon, das einem großen 
Datenkabel entspricht, an dessen Ende der Impuls über die eigenen Synapsen des 
Neurons wieder an nachgeschaltete Zellen weitergegeben wird. Dieser Prozess findet 
kontinuierlich in allen Neuronen statt, die in ganz unterschiedlichen Netzwerkstruk- 


Künstliches neuronales Netz (KNN, vereinfachte Darstellung) 
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NEURONEN VERSTECKTE NEURONEN NEURON 


Abbildung A.5: In einem KNN werden Eingabewerte in Schichten versteckter Neuronen (hier 
beispielhaft zwei Schichten) verarbeitet. Wenn Rückkopplungen (hier der hellblau gepunk- 
tete Pfeil) eingesetzt werden, spricht man von einem rekurrenten Netz. Das Ergebnis der 
Berechnung sind die Ausgabewerte der Ausgabeneuronen (hier nur eins) 
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turen verschaltet sein können. Eine wesentliche Eigenschaft biologischer Neuronen 
ist dabei die Verschaltungsstärke oder Gewichtung, mit der ein Neuron seinen elekt- 
rischen Impuls jeweils individuell an zahlreiche andere Neurone überträgt. Diese Ver- 
schaltungsstärke bzw. ihre Änderung ist neben der Netzwerkstruktur der Neuronen 
eine wesentliche Eigenschaft für die Verarbeitung von Informationen in biologischen 
neuronalen Netzwerken. 


Einzelne Neuronen können seit 1952 mit Hilfe des Hodgkin-Huxley-Modells simuliert 
werden (Hodgkin und Huxley 1952), wobei heute sowohl vereinfachte als auch 
komplexere Simulationsmodelle in Gebrauch sind. Die Simulation ganzer Netzwerke 
kann in Hinblick auf den Rechenaufwand sehr aufwendig sein. Aktuell werden ins- 
besondere im Human Brain Project” große Netzwerke von Neuronen simuliert, pers- 
pektivisch sogar in der Größenordnung der Anzahl der biologischen Neuronen im 
menschlichen Gehirn. 


Liest man über neuronale Netze im Bereich KI, so sind damit KNN gemeint, die nicht 
auf eine genaue Abbildung der biologischen Verhältnisse abzielen, sondern vielmehr 
nur abstrakt von der Modellierung biologischer neuronaler Netze motiviert sind. Sie 
setzen primär die Konzepte der Verschaltungsstärke bzw. Gewichtung und des 
Schwellenwerts informatorisch um. Solche KNN erfüllen ihren Zweck aber in aktuel- 
len Anwendungen. Der KI-Boom speist sich vor allem daraus, dass die Konzepte 
neuronaler Netze auf bestimmter Hardware stark parallelisiert und effizient ausge- 
führt werden können (siehe Beitrag 1 „Hardware für KI“). 


Die grundlegende Funktionsweise eines neuronalen Netzes ist in Abbildung A.5 dar- 
gestellt. Es erhält Eingabewerte, führt darauf Berechnungen durch und ermittelt 
schließlich die Ausgabewerte. Wie in der Abbildung dargestellt, fließen Informatio- 
nen auf der linken Seite hinein, durchlaufen das Netz und fließen auf der rechten 
Seite verarbeitet hinaus. Dabei können in einem komplexeren Netz die Eingabewerte 
links beispielsweise die Farbwerte der Pixel eines Bildes sein und der Ausgabewert 
rechts eine Aussage, ob auf diesem Bild ein Hund erkennbar ist. In diesem Fall kön- 
nen die Ausgabewerte ein einfaches Klassifikationsergebnis, also beispielsweise eine 
1 (wahr - Hund erkannt) oder O (falsch - kein Hund erkannt) sein. Die Ausgabewerte 
können aber auch eine beliebig komplexere Bedeutung haben. Bei jedem Verarbei- 
tungsschritt werden die Werte aus der jeweils vorhergehenden Ebene weitergeleitet 
an die einzelnen Neuronen der nächsten Ebene. In einem Neuron der Folgeebene 
kommen also Werte mehrerer Neuronen an. Wie auch im biologischen Vorbild ist die 


* Das Human Brain Project ist ein seit 2013 von der Europäischen Kommission gefördertes 
Forschungsprojekt, an dem über zehn Jahre hinweg mehr als 100 Institutionen beteiligt 
sind. Die Gesamtkosten betragen mehr als eine Milliarde Euro. 
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Gewichtung der Werte ein wesentliches Element des Netzes. Alle eingehenden 
Werte werden im Neuron in Hinblick auf ihre Gewichtung und den Schwellwert des 
jeweiligen Neurons zu einer Ausgabe verarbeitet, die es dann wiederum an mehrere 
Neuronen der Folgeschicht weitergibt. Dieser Prozess wiederholt sich bis zur letzten 
Ebene. Zwischen der ersten Schicht, den Eingabe-Neuronen, und der letzten Schicht, 
den Ausgabe-Neuronen, liegen die sogenannten versteckten Neuronen (Hidden 
Neurons). Aufgrund der Richtung des Informationsflusses nennt man ein solches 
Netz Feedforward-Netz. Möglich sind selbstverständlich auch komplexere Netzwerk- 
strukturen, in denen die Informationen gleichzeitig nach vorne und teilweise auch 
nach hinten fließen. Beispielsweise könnten die verarbeiteten Informationen einer 
Neuronenschicht nicht nur an die nächste Schicht weiterfließen, sondern auch an die 
vorhergehende Schicht zurückgekoppelt werden. Solche Netze bezeichnet man als 
rekurrente Netze. Die Rückkopplung kann eine Art von „Informationserinnerung” im 
Netz darstellen und je nach Anwendungsfall sinnvoll werden. 


Ein leeres Netz muss zunächst trainiert werden, um seine gewünschte Funktion zu 
erfüllen. Die Gewichtungen an allen Stellen des Netzes müssen so justiert werden, 
dass das gewünschte Ergebnis erzielt wird. Beispielsweise müsste ein Netz erst ler- 
nen, ob auf Bildern ein Hund abgebildet ist oder nicht. Dieses Anlernen (Training) des 
Netzes ist dabei viel aufwendiger und rechenintensiver als die spätere Nutzung des 
Netzes zur Erkennung von Mustern (Inference). Eine Methode zum Anlernen ist die 
„Backpropagation”, die zu den überwachten Lernmethoden gehört. Dabei fließen 
Eingabewerte in das Netz ein und das Netz errechnet Ausgabewerte. Anschließend 
wird verglichen, wie weit diese errechneten Ausgabewerte von den Ausgabewerten, 
die sich eigentlich richtigerweise aus den Eingabewerten ergeben müssten, abwei- 
chen. Diese Abweichung bzw. dieser Fehler muss so weit wie möglich gesenkt wer- 
den. Dazu werden die Gewichtungen innerhalb des Netzes angepasst. Dann durch- 
laufen die Eingabewerte wieder das Netz und produzieren neue Ausgabewerte, die 
wiederum einen gewissen Fehler haben. Dieser Vorgang wird wiederholt, bis der 
Fehler der Ausgabe ausreichend gering ausfällt. Dazu müssen zu allen Eingabewer- 
ten die richtigen Ausgabewerte bekannt sein. Beispielsweise könnte das Netz auf 
10.000 Bilder trainiert werden, wobei sich auf vielen Bildern Hunde befinden und auf 
dem Rest nicht. Danach kann es idealerweise auf neuen unbekannten Bildern erken- 
nen, ob ein Hund abgebildet ist oder nicht. Dabei wird es allerdings manchmal, hof- 
fentlich möglichst selten, falsch entscheiden. 


Wenn ein KNN wie oben beschrieben trainiert wird, dann handelt es sich um über- 
wachtes Lernen. KNN können aber ebenfalls für unüberwachtes und für verstärktes 
Lernen eingesetzt werden. 


Für das Beispiel der Erkennung von Hundebildern sind die skizzierten Arten bzw. 
Funktionen von neuronalen Netzen allerdings noch nicht ausreichend gut. Vielmehr 
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würde man dafür aktuell „faltende” neuronale Netze (Convolutional Neural Net- 
works, kurz CNN) heranziehen. Faltungen sind mathematische Funktionen, die in der 
Software zahlreicher Hochtechnologien genutzt werden. In einem CNN kommen in 
verschiedenen Schichten Faltungen zum Einsatz, die Bildinformationen bzw. Merk- 
male abstrahieren. In Bildern mit möglichen Hunden sitzen oder laufen die Tiere 
natürlich nicht immer an der gleichen Stelle. Was einen Hund ausmacht, ist nicht 
seine Position im Bild, sondern es sind vielmehr Eigenschaften wie das abgebildete 
flauschige Fell, das im Bild bestimmte weiche Kanten zur Umgebung produziert, 
bestimmte Muster aus Augen, Schnauze und Ohren oder vier Beine mit hellen Pfoten 
an den Enden, die in bestimmten Positionen zueinander stehen. Diese Eigenschaften 
sind manchmal konkreter und manchmal abstrakter, sie finden sich aber nie in den 
reinen Rohdaten der Pixel eines Bildes. Deshalb funktioniert ein CNN so, dass es Teile 
des Bildes als Ganzes auswertet und so beispielsweise ein abstraktes Merkmal wie 
die flauschige, auf dem Bild leicht verschwommene Abgrenzung des Hundes von 
seiner Umgebung weiterverarbeitet. Das Bild wird also in den Schichten des Netzes 
abstrahiert und die abstrakteren Merkmale führen am Ausgang des Netzes zu der 
Entscheidung, ob ein Hund auf dem Bild zu sehen ist oder nicht.” 


Eine weitere Methode im Bereich der neuronalen Netze sind sogenannte Generative 
Adversarial Networks (GAN) (Goodfellow et al. 2014). In gewisser Hinsicht kämpfen 
bei dieser Methode zwei Netzwerke gegeneinander. Dem eigentlich eingesetzten 
Netz, das lernen soll, wird ein Gegnernetz gegenübergestellt, das die Eingabewerte 
des lernenden Netzes erzeugt. Das Gegnernetz ist dabei aber so verschaltet, dass es 
lernt, Eingabewerte zu produzieren, die für das lernende Netz möglichst schlechte 
Ergebnisse mit einem hohen Grad an Fehlern liefern. Das Gegnernetz konfrontiert 
das lernende Netz also immer und immer wieder mit seinen Schwächen und führt es 
an seine Grenzen. Das Ergebnis dieser Auseinandersetzung ist, dass das lernende 
Netz exzellent wird und selbst mit schwierigen Eingabewerten zurechtkommt. 


Unter KI, ML und DL versteht man heute eine ganze Reihe von Ansätzen, Probleme 
mit Hilfe von autonom agierenden und in diesem Sinne intelligenten Computerpro- 
grammen zu lösen. In den folgenden Kapiteln soll auf bestimmte Teilbereiche der 
Technologie genauer eingegangen werden. Kapitel 1 beschreibt, welche Rechen- 
hardware nötig ist, um neuronale Netze überhaupt effizient ausführen zu können. 
Kapitel 2 zeigt mit einer Übersicht zu Normung und Standardisierung auf, wie KI- 
Werkzeuge aktuell gehandhabt werden. In Kapitel 3 wird dargestellt, wie der Mensch 
mit komplexen KI-Systemen interagieren kann und könnte. Kapitel 4 befasst sich mit 
Ansätzen und Methoden im Anwendungsgebiet IT-Sicherheit. 


° Jeder, der schon einmal Google Fotos verwendet hat, kennt die Güte der Mustererken- 
nung in Bildern (Computer Vision). 
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1. Hardware für Kl 


Markus Schürholz, Eike-Christian Spitzner 


Die KI ist bereits seit Jahrzehnten ein Thema in der Forschung, wobei die Kon- 
ferenz „Dartmouth Summer Research Project on Artificial Intelligence“ im Jahr 
1956 als Startpunkt systematischer Forschungsanstrengungen gilt. Den wirk- 
lichen Durchbruch brachte allerdings erst in den vergangenen Jahren der Ein- 
satz von künstlichen neuronalen Netzen (KNN) mit Methoden des tiefen Ler- 
nens (Deep Learning, DL), welche rudimentär Abläufe im Nervensystem nach- 
bilden (siehe auch Einleitung Teil A). Wichtige Treiber sind aber nicht nur die 
Konzepte der KNN, sondern vor allem auch die Entwicklung der Rechentech- 
nik, auf der entsprechende Verfahren ausgeführt werden. Während man zu 
Beginn auf leistungsfähige Allzweckprozessoren (central processing unit, CPU) 
zurückgriff, werden seit einigen Jahren vorrangig Prozessoren verwendet, die 
ursprünglich für Grafikkarten zur Bildausgabe gedacht waren (graphics pro- 
cessing unit, GPU). Aktuell werden diese zunehmend zu Spezialprozessoren 
(application-specific integrated circuit, ASIC) für Kl-Anwendungen weiterent- 
wickelt. Zusätzlich verfolgt man den Ansatz, die Struktur von KNN direkt in 
der Architektur eines Prozessors abzubilden (neuromorphe Hardware). Dabei 
sind erste Versuche erfolgversprechend. 


Um die Entwicklung der Hardware für Kl-Anwendungen besser einordnen zu kön- 
nen, ist es zunächst hilfreich sich anzusehen, welche Berechnungen bei der Nutzung 
von KNN mit DL-Ansätzen durchgeführt werden. Hierbei muss man noch klar zwi- 
schen dem Anlernen des KNN (Training) und seinem späteren Einsatz (Inference) 
unterscheiden, wobei ersteres sehr rechenaufwendig ist. Die in diesem Beitrag 
beschriebene Hardware dient insbesondere der Beschleunigung des Trainings. Im 
Prinzip bestehen KNN aus einzelnen konzeptionellen Neuronen, die in bestimmten 
Schichten angeordnet sind. Bei mehrschichtigen Netzwerken ist die erste Schicht die 
Eingabeschicht, die Daten entgegennimmt. Die letzte Schicht, welche das Ergebnis 
liefert, ist die Ausgabeschicht. Gibt es zwischen Ein- und Ausgabeschicht weitere 
Schichten (Hidden Neurons), wird das neuronale Netzwerk deutlich leistungsfähiger, 
und man spricht von DL. Zwischen den einzelnen Schichten bestehen Verbindungen 
zwischen Neuronen, die das eigentliche Netzwerk bilden. Diese Verbindungen haben 
verschiedene Strukturen, nach denen neuronale Netze auch klassifiziert werden kön- 
nen (siehe auch Einleitung Teil A „Entwicklungswege zur KI”). Ein einfacher Fall ist 
dabei ein Feedforward-Netz, in dem jedes einzelne Neuron einer Schicht über Verbin- 
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dungen die Informationen den Neuronen der nächsten Schicht senden, jedoch nicht 
zurücksenden kann. 


Das eigentliche „Wissen” des Netzes steckt, entsprechend einem biologischen neu- 
ronalen Netz, in der Gewichtung der einzelnen Verbindungen zwischen den künstli- 
chen Neuronen. Diese Struktur muss zunächst erzeugt werden, das Netz wird also 
angelernt. Eine gängige Methode hierfür ist das Überwachte Lernen (Supervised 
Machine Learning). Dabei trainiert man das Netz mit bekannten Eingangsdaten 
sowie Ausgangsdaten und stellt die Gewichtung der einzelnen Verbindungen so ein, 
dass Fehler am Ausgang minimal ausfallen. So kann ein neuronales Netz zum Beispiel 
trainieren, auf Bildern Hunde und Katzen zu unterscheiden, indem man am Eingang 
Bilder verwendet, von denen bekannt ist, welche der beiden Tierarten darauf zu 
sehen ist (Wert am Ausgang). Die Trainingsphase ist abgeschlossen, wenn das neu- 
ronale Netz mit unbekannten, nicht für das Training verwendeten Daten eine Fehler- 
rate erreicht, die unter einem vorher festgelegten und der Anwendung angemesse- 
nem Wert liegt. Grundsätzlich kann man sagen, dass ein neuronales Netz mit mehr 
Schichten und mehr Neuronen, zusammen mit möglichst vielen Trainingsdaten, the- 
oretisch die besten Resultate erzeugt, gleichzeitig aber mit der Anzahl der Neuronen, 
der Anzahl der Schichten und der Menge an Trainingsdaten der Rechenaufwand 
erheblich steigt. Diese Berechnungen können auf unterschiedliche Art und Weise in 
Software umgesetzt werden. Wichtig dabei ist jedoch, dass die Berechnungen in der 
Regel so implementiert sind, dass mathematisch hauptsächlich Matrixmultiplikatio- 
nen und Vektoradditionen durchgeführt werden. Im Folgenden wird am Beispiel der 
Matrixmultiplikation gezeigt, warum dies einen entscheidenden Einfluss darauf hat, 
welche Hardware für Kl-Anwendungen besonders effizient ist. 


Matrix A multipliziert mit Matrix B ergibt dabei eine neue Matrix C (siehe Abbildung 
1.1). Die vier Elemente der Ergebnismatrix C werden dabei unabhängig aus Elemen- 
ten der Matrizen A und B berechnet und enthalten keine unmittelbaren Abhängig- 
keiten untereinander. Das heißt, die Matrixmultiplikation kann sehr einfach in vier 
Rechnungen aufgeteilt werden, die nicht aufeinander aufbauen und aus diesem 
Grund gleichzeitig ausgeführt werden können, ohne auf ein anderes Zwischenergeb- 


A, A, * B, B, = A „B, +A,B,, ABa t AB 
A, A,| \B,, B„| (A„B,+A,B, A,B,+A,B 


22 22, 21 21 12 22, 22 


Abbildung 1.1: Multiplikation zweier Matritzen 
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nis warten zu müssen. Jede einzelne Rechnung besteht dabei nur aus einer Addition 
zweier Multiplikationen, zum Beispiel A, ,B,, + A,,B,,, wobei die beiden Multiplikati- 
onen auch gleichzeitig ausgeführt werden können, um in einem zweiten Schritt 
addiert zu werden. Die auf den ersten Blick recht aufwendige Multiplikation zweier 
Matrizen lässt sich so in viele einfache Teile zerlegen. Es wird deutlich, dass in einem 
ersten Schritt acht Multiplikationen gleichzeitig und in einem zweiten Schritt vier 
Additionen gleichzeitig ausgeführt werden können. Insgesamt lässt sich diese Rech- 
nung also sehr gut parallelisieren, was wiederum der entscheidende Punkt für die 
Wahl der Hardware ist. Zur Verfügung stehen dafür im Allgemeinen Universalprozes- 
soren (CPU), Beschleunigerkarten, die im Wesentlichen auf Grafikprozessoren basie- 
ren (GPU), und anwendungsspezifische Schaltungen (ASIC). 


Aktuelle Hardware-Lösungen 


Die meisten heute verwendeten Universalprozessoren, wie beispielsweise die Haupt- 
prozessoren in allen gängigen Computern wie auch Mobilgeräten und Servern, 
basieren grundlegend auf einer Architektur, die John von Neumann im Jahr 1945 
beschrieb und die auch nach ihm benannt ist (von-Neumann-Architektur). Kennzei- 
chen dieser Architektur ist ein gemeinsamer, zentraler Speicher für Daten und Inst- 
ruktionen. Dies ist konzeptionell sehr effizient, da möglichst leistungsfähige Rechen- 
werke die Programme sequenziell, also Schritt für Schritt, abarbeiten sollen. Opti- 
miert ist ein solcher Prozessor für aufeinander aufbauende, komplexe Berechnungen, 
nicht jedoch für parallelisierbare Aufgaben. Dies gilt grundsätzlich, ist heute jedoch 
nur noch eingeschränkt gültig, da sich die Entwicklung der CPUs in den vergangenen 
Jahrzehnten ein Stück weit von den Ursprüngen entfernt hat. Moderne CPUs verfü- 
gen über hohe Taktraten und eine hohe Rechenleistung pro Takt, und durch Befehlser- 
weiterungen sind sie in der Lage, auch komplexere Berechnungen in einem oder sehr 
wenigen Schritten auszuführen. Zudem ist mit diesen modernen CPUs inzwischen 
auch ein paralleles Abarbeiten mehrerer Aufgaben möglich, da sie mehrere Prozess- 
orkerne (in Smartphones aktuell bis zu 10, in Serverprozessoren 32 und mehr) bein- 
halten und Technologien wie SMT (simultaneos multithreading) dies unterstützen - 
eine Technik, die es erlaubt, im begrenzten Umfang zwei Aufgaben auf demselben 
Prozessorkern auszuführen. Moderne CPUs sind also sehr leistungsfähig, vielseitig 
und können komplexe Probleme schnell bearbeiten. Für Rechnungen, die massiv par- 
allelisiiert werden können und aus eher einfachen Teilaufgaben bestehen, ist eine 
CPU jedoch weiterhin eher ungeeignet. Die Teilschritte werden zwar sehr schnell 
ausgeführt, die Anzahl der parallel ausgeführten Aufgaben ist jedoch begrenzt. Die 
große Rechenleistung der einzelnen Kerne und viele Optimierungen moderner Pro- 
zessoren wie etwa Befehlssatzerweiterungen können kaum oder nicht genutzt wer- 
den - mit der Folge, dass letztlich ein solcher Prozessor mit parallelen Rechenarbeiten 
nicht optimal ausgelastet werden kann. 
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In den vergangenen Jahren wurde deshalb für solche Berechnungen immer häufiger 
Hardware verwendet, die eigentlich für die Bildausgabe entwickelt wurde. Diese 
basiert auf sogenannten GPUs. Die Leistungsfähigkeit dieser Grafikhardware ist, 
besonders im Vergleich zu CPUs, in jüngster Zeit verhältnismäßig stark gestiegen. 
GPUs bestehen aus ähnlichen Einzelbausteinen wie CPUs, unterscheiden sich in der 
Gesamtarchitektur jedoch deutlich. Für die Berechnung einzelner Bildpunkte nutzten 
GPUs früher kleine Rechenkerne, sogenannte Shader, die auf bestimmte Funktionen 
optimiert waren und nur diese ausführen konnten. Es gab spezialisierte Shader, 
beispielsweise um die Farbe, die Transparenz oder Geometrie einzelner Bildpunkte 
oder Bildbereiche zu berechnen. Ob die einzelnen Funktionen jedoch genutzt 
wurden, hing dabei stark von der Software ab. Um die Hardware generell besser 
auslasten zu können, basieren moderne GPUs deswegen auf universellen Shadern, 
sogenannten Unified Shader-Architekturen. Diese generalisierten Shader sind in der 
Lage, je nach Bedarf jede der gewünschten Funktionen auszuführen. Bedingung ist, 
dass jeder Shader direkt programmiert werden kann, was ihn zu einem kleinen 
Universalprozessor macht. Diese Fähigkeit ermöglicht es nun, solche GPUs nicht 
mehr nur zur Bildberechnung zu nutzen, sondern sie auch andere Berechnungen 
anstellen zu lassen, was sie zu GPGPU („general purpose computation on graphics 
processing unit”) werden lässt. Bei der Verwendung als GPGPU kann nun jeder 
Shader als eine Art Universalrechenkern angesehen werden. Ein solcher Kern ist für 
sich genommen im Vergleich zu einem CPU-Kern zwar erheblich schwächer und 
deutlich niedriger getaktet, moderne GPUs verfügen jedoch über tausende ent- 
sprechender Shader, zwei Größenordnungen mehr als eine CPU. Ein weiterer Unter- 
schied zur CPU besteht darin, dass der Speicher einer Grafikkarte um etwa einen 
Faktor zehn schneller angebunden ist, was besonders bei großen Datenmengen von 
Vorteil ist. 


Eine dritte Möglichkeit Berechnungen durchzuführen, ist die Verwendung anwen- 
dungsspezifischer integrierter Schaltkreise (ASIC). Hierbei handelt es sich im Gegen- 
satz zu CPUs und in Grenzen GPUs nicht um Universalprozessoren, die prinzipiell in 
der Lage sind, fast jede Berechnung durchzuführen. ASICs sind speziell für nur eine 
bestimmte Aufgabe entworfene Schaltkreise. Die Grenze, an der ein modifizierter 
oder ergänzter Universalprozessor aufhört und ein ASIC beginnt, ist dabei durchaus 
fließend, für die Auswahl von Kl-Hardware aber nicht zwingend wichtig. 


Relevant für die Kl-Anwendung ist zum einen Hardware, die auf Matrixrechenopera- 
tionen spezialisiert ist. Derartige Hardware ist zurzeit in Form von speziellen, zusätz- 
lichen Rechenkernen auf Kl-Beschleunigern wie Nvidia Tensor Core (NVIDIA TESLA 
V100 GPU ARCHITECTURE) oder ganzen darauf spezialisierten Prozessoren wie bei 
Google, tensor processing unit, TPU verfügbar. Zum anderen gibt es auch Bestrebun- 
gen für Kl-Anwendungen, bei denen ein KNN komplett in Hardware abgebildet 
werden soll, sogenannte neuromorphe Hardware. 
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Die aktuell gängigen Implementationen von KNN basieren darauf, dass im Wesentli- 
chen sehr viele Matrixoperationen ausgeführt werden. Wie am Beispiel der Matrix- 
multiplikation gezeigt, sind solche Aufgaben inhärent parallelisierbar, lassen sich also 
in viele recht einfache Rechnungen zerlegen, die größtenteils gleichzeitig stattfinden 
können. Von den Optimierungen moderner, auch leistungsfähiger CPUs mit ihrer 
noch begrenzten Fähigkeit zum Parallelrechnen kann solch eine Anwendung aller- 
dings kaum profitieren. Vielmehr können GPUs, ursprünglich für Grafikhardware 
bzw. Beschleunigerkarten entwickelt, hier ihr Potenzial voll ausspielen. Dies ist auch 
der wesentliche Grund dafür, dass viele KI-Anwendungen erst mit der Nutzung von 
GPUs den Durchbruch schafften. Zuvor waren nur sehr teure Großrechner in der 
Lage, entsprechende Berechnungen in angemessener Zeit durchzuführen. Großes 
Zukunftspotenzial haben auch auf Matrixoperationen spezialisierte ASICs, wie sie 
gegenwärtig schon nach und nach zum Einsatz kommen. Die Unterschiede in der 
Effizienz sind dabei deutlich: So gibt Google für die eigens entwickelte TPU - ein 
ASIC für Vektoroperationen - bei Kl-relevanten Berechnungen etwa die 80-fache 
Rechenleistung gegenüber einer CPU und die 30-fache Rechenleistung gegenüber 
einer GPU an, wobei diese Werte auf die aufgenommene elektrische Leistung, also 
pro Watt, normiert sind (Jouppi et al. 2017; Hot Chips 2017: A Closer Look At Goo- 
gles TPU v2). 


Die skizzierten Unterschiede in den Prozessor-Architekturen verdeutlichen, welch 
wichtige Rolle der verwendeten Hardware für den Erfolg von Kl-Konzepten zukommt. 
Im folgenden Abschnitt wird deshalb ein genauerer Überblick gegeben, welche 
Akteure hier mit welcher Hardware im Markt aktiv sind. Grundsätzlich lässt sich fest- 
halten, dass sich die Rechentechnik für KI-Anwendungen immer weiter von der klas- 
sischen von-Neumann-Rechenmaschine entfernt. Ein interessanter Aspekt der Ent- 
wicklung, denn von Neumann hatte für sein Konzept der Rechenmaschine eigentlich 
das zentrale Nervensystem des Menschen durchaus als ein Vorbild betrachtet und die 
Gemeinsamkeiten und Unterschiede in seinem Buch „Die Rechenmaschine und das 
Gehirn“ (Neumann 1960) schon vor Jahrzehnten präzise durchdacht. 


Marktübersicht 


Zahlreiche Hersteller bieten bereits für Kl-Anwendungen optimierte Rechenhardware 
an und es kommt stetig neue hinzu. Die erste große wirtschaftliche Erfolgsgeschichte 
einer Kl-Hardware ist mit dem Namen Nvidia Corporation verbunden: Das in Kalifor- 
nien beheimatete Unternehmen wurde 1993 gegründet und begann mit der Kom- 
merzialisierung von GPUs, die sich speziell für den Einsatz in der 3D-Computergrafik 
eigneten und mit denen sich zahlreiche Aspekte computergenerierter Bilder parallel 
rechnen ließen. Um die Jahrtausendwende hatte sich das Unternehmen in diesem 
Bereich sehr erfolgreich am Markt positioniert. Es folgten Firmenübernahmen und 
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Expansion, u. a. auch durch den Zukauf der Berliner Mental Images GmbH im Jahr 
2007. Im gleichen Jahr veröffentlichte Nvidia mit CUDA (Compute Unified Device 
Architecture) eine Schnittstelle für seine Hardware, um GPGPU für das unspezifische 
Abarbeiten parallelisierbarer Rechenaufgaben zu ermöglichen. 


Das war der Startschuss für eine breite Nutzung der Grafikkarten für DL in einer gro- 
Ben Forschungsgemeinschaft. Ebenfalls 2007 brachte Nvidia den ersten Prozessor 
der Tesla-Reihe auf den Markt, dessen aktuelle Version Volta heißt. Die Strukturgröße 
der Transistoren im Volta ist nur noch zwölf Nanometer groß, und der Chip umfasst 
mehr als 5.000 Shader - ein großer Unterschied also zu den 28 Rechenkernen in 
Intels aktueller CPU. Nvidia spricht in Hinblick auf die aktuellste Volta-Generation von 
neuen „Tensor Cores”®. Der Begriff in der Benennung von Chips soll darauf hindeu- 
ten, dass Matrixoperationen auf diesen Chips sehr effizient durchgeführt werden 
können. Während bei CPUs die Leistungszuwächse (oft beschrieben durch das 
„Mooresche Gesetz”) in den vergangenen Jahren von Generation zu Generation 
eher kleiner wurden, konnten Nvidias GPUs in den aktuellsten Generationen enorme 
Leistungssprünge verzeichnen. 


Gegenüber CPUs, die sich seit vielen Jahren in PCs, Servern — heute meist Cloud 
genannt — und mittlerweile insbesondere in Smartphones befinden, konnte Nvidia 
mit seinen neuen KI-Chips ein völlig neues Marktsegment erschließen. Dies spiegelt 
sich deutlich in der unterschiedlichen Entwicklung der Aktienkurse von Nvidia und 
vom Hersteller klassischer CPUs Intel wider (siehe Abbildung 1.2). Und Nvidias KI- 
Chips können auch in der Cloud als mächtige Kl-Rechencluster genutzt werden. Inte- 
ressanterweise arbeitet das Unternehmen für dieses Angebot mit Microsoft und dem 
im Cloud-Computing dominanten Amazon zusammen. Im Rahmen seines „Al Lab” - 
Programms kooperiert Nvidia mit wichtigen KI-Forschungseinrichtungen. Als einen 
der beiden ersten europäischen Partner wählte Nvidia das Deutsche Forschungszen- 
trum für Künstliche Intelligenz (DFKI) in Saarbrücken (Auel 2016). 


Aufgrund der absehbar auch künftig dynamischen Marktentwicklung von KI für eine 
steigende Anzahl von Anwendungen hat auch der Konzern Google, der sich die 
Entwicklung von KI seit Unternehmensgründung als langfristiges Ziel auf die Fahnen 
geschrieben hatte, eine eigene Hardware entwickelt. Deren Name TPU (Tensor Pro- 
cessing Unit), orientiert sich an den Begriffen CPU und GPU. Die gegenwärtig bereits 
in der zweiten Generation verfügbaren Google-TPUs dienen ebenfalls dazu, Matrix- 


€ Da auch Google den Begriff Tensor für die eigene Hardware verwendet, sei kurz darauf 
hingewiesen, dass es sich bei einem Tensor um ein mathematisches Objekt handelt, das in 
einfachen Fällen eine Zahl oder ein Vektor ist, in komplexeren Fällen eine multidimensio- 
nale Matrix. 
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Abbildung 1.2: Aktienpreise, der Preis vom 1. Januar 2012 entspricht 100, um das Verhält- 
nis der Kurssteigerung abzubilden (eigene Darstellung basierend auf IDC, Thomson Reuters). 


operationen effizient auszuführen. Die Chips wurden dabei so gestaltet, dass die von 
Google entwickelte Open-Source-Softwarebibliothek TensorFlow effektiv damit ver- 
wendet werden kann. Google stellt die TPUs im Rahmen des eigenen Cloud-Ange- 
botes zur Verfügung; prominent eingesetzt wurde die Hardware bei dem 2016 Auf- 
sehen erregenden Sieg von AlphaGo über den Go-Spieler Lee Sedol. 


Während diese Entwicklungsansätze von KlI-Hardware einerseits auf den lokalen Ein- 
satz zielen und andererseits aufgrund ihrer Effizienz mit CPUs in Rechenzentren oder 
Supercomputern konkurrieren, werden schon mobile Chips mit Recheneinheiten 
ausgestattet, die ML unterstützen. Anwendungen fallen dabei in vielen Fällen in den 
Bereich Computer Vision, in dem mit ML eindrucksvolle Erfolge erzielt werden konn- 
ten. Microsoft setzt beispielsweise in seiner für Augmented bzw. Mixed Reality 
Anwendungen entwickelten HoloLens eine Holo Processing Unit ein, die CPU und 
GPU unterstützt - also eine HPU, der allgemeinen Bezeichnungstradition folgend. 


Gegenwärtig weitverbreitet ist der sogenannte A11 Bionic Chip, der im iPhone 8 
(Plus) und X eingesetzt wird. Die System-on-a-Chips (SoCs), die bisherige iPhone- 
Generationen antrieben, enthielten bereits mehrere Prozessoren, neben einer CPU 
und GPU auch gesonderte Prozessoren, die nur Bewegung erfassen und dabei beson- 
ders energieeffizient sind. Seit dem A11 Bionic umfasst der Chip auch einen von 
Apple als Neural Engine bezeichneten Prozessor, der für Machine Learning insbeson- 
dere im Bereich Computer Vision angewendet wird. So ermöglicht diese Neural 
Engine die nahezu in Echtzeit stattfindende Entsperrung des Smartphones durch 
lokal ausgeführte Gesichtserkennung (Face ID). Und obwohl auch andere Hersteller 
von Smartphone-Chips auf lokale KI-Hardware setzen, sticht die Neural Engine auch 
deshalb hervor, weil sie dabei hilft, den von Apple favorisierten Entwicklungsansatz 
zu unterstützen, Daten so weit wie möglich auf dem Endgerät des Nutzers zu belas- 
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sen und dort zu verarbeiten. Während bei Google eingestellte Bilder in die Cloud 
geladen werden und erst dort Mustererkennung auf den Fotos stattfindet, ermög- 
licht die Neural Engine eine effiziente Mustererkennung von Fotos auf dem iPhone. 


Ebenfalls für den Bereich Computer Vision vorgesehen ist die Vision Processing Unit 
(VPU) von Intel, die aktuell den Namen Myriad X trägt und auf Technologie von Movi- 
dius fußt. Bevor dieses Unternehmen 2016 von Intel übernommen wurde, stellte es 
die kleine und energieeffiziente Computer-Vision-Technologie für Drohnen von DJI 
bereit. Mit einem Verbrauch im Bereich von einem Watt eignet sich der aktuelle 
Myriad X für den mobilen Einsatz und kann Stereo-Bildquellen mit einer Auflösung 
von 720 Pixel bei einer Frequenz von 180 Hertz auswerten. Im selben Jahr wie Movi- 
dius übernahm Intel 2016 auch Nervana Systems, deren Technologie im aktuellen 
Nervana Neural Network Processor (NNP) verbaut wird und für den nicht-mobilen 
Einsatz konzipiert ist. Die beiden Übernahmen wirken wie ein Doppelschlag, um sich 
gegen bereits etabliertere Konkurrenten am Markt zu positionieren. Darüber hinaus 
übernahm Intel im Bereich Automotive das israelische Unternehmen Mobileye, das 
spezifische Sensoren für Fahrassistenzsysteme anbietet. Der milliardenschwere Kauf 
besiegelte den größten Exit der israelischen Technologiewirtschaft. 


Neben Nvidia und den bekannten Riesen erforschen und entwickeln diverse Start- 
ups eigene Lösungen von unterschiedlicher öffentlicher Transparenz, die hier nur 
exemplarisch vorgestellt werden können. Zu nennen wäre beispielsweise Graphcore, 
ein 2016 in Großbritannien gegründetes Start-up, das sein System Intelligence Pro- 
cessing Unit (IPU) nennt und damit nach eigenen Angaben beeindruckende Perfor- 
mances erreicht. Das 2013 in Beijing gegründete Unternehmen Bitmain Technologies 
entwickelt ASICs, die für das Mining von Bitcoins optimiert sind. Bitmain weitet seine 
Aktivitäten gerade in den Bereich ASICs für Kl-Anwendungen aus und verfolgt dabei 
technisch einen ähnlichen Ansatz wie Google. Die Lösung von Wave Computing 
wird Dataflow Processing Unit genannt und ist für den Einsatz in Servern bzw. der 
Cloud konzipiert. Wie konkurrenzfähig Start-ups wie Groqg, Cerebras (beide USA) 
oder Cambricon (China) in der nächsten Zeit sein werden, ist noch nicht abzuschät- 
zen. 


Ausblick 


Die Entwicklung von Kl-Anwendungen und deren praktische wie wirtschaftliche 
Bedeutung werden auch künftig maßgeblich von Entwicklungen im Bereich der 
Hardware abhängen. Die Adaption von KNN auf GPU-Hardware war in der Vergan- 
genheit ein essenzieller Schritt, um deren Berechnung um Größenordnungen zu 
beschleunigen und Zeitskalen zu erreichen, die eine praktische Anwendung erlau- 
ben. Ähnliche Schritte sind auch in Zukunft zu erwarten. Mobile Kl-Anwendungen, 
bei denen neuronale Netze auf kleinen, mobilen Geräten ausgeführt werden, benö- 
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tigen Spezialhardware, die neben hoher Leistung auch eine sehr niedrige Leistungs- 
aufnahme aufweist. Erste Entwicklungen zeigen sich etwa im Bereich der Mobiltele- 
fone, wo KI-Koprozessoren verwendet werden, um beispielsweise die Qualität der 
damit aufgenommen Fotos und/oder deren inhaltliche Auswertung zu verbessern. 
Enorme Potenziale für die Zukunft lassen sich in aktuellen Forschungsergebnissen zu 
neuromorphen Prozessoren erkennen. IBM zum Beispiel zeigt bereits die zweite 
Generation seines Demonstrations-Kl-Prozessors TrueNorth, welcher in Hardware 
eine Million Neuronen mit 256 Millionen Synapsen implementiert (Merolla et al. 
2014). Dieser Prozessor ist in der Lage, typische Aufgaben der Bildauswertung mit 
hoher Genauigkeit und Geschwindigkeit durchzuführen, benötigt dafür aber im Ver- 
gleich zum kommerziellen Stand der Technik Größenordnungen weniger elektrische 
Energie (25 bis 275 Milliwatt) (Esser et al. 2016). 


Die Hardware ist dabei deswegen so effizient, weil sie in Grenzen das KNN bereits in 
ihrer Schaltung widerspiegelt. Einzelne Rechenkerne bilden die Neuronen, die unter- 
einander vernetzt sind (Synapsen), wobei jeder dieser „neurosynaptischen“ Rechen- 
kerne seinen eigenen Speicher hat. Hier zeigt sich in besonderem Maße die Abkehr 
von klassischen Architekturen, bei denen Rechenwerke und Speicher klar getrennt 
sind. Bei Berechnungen können jedoch alle Kerne mehr oder minder parallel arbeiten 
und blockieren sich nicht gegenseitig bei der Abfrage von Gewichtungsinformatio- 
nen, die bei klassischen Architekturen in einem gemeinsamen zentralen Speicher 
liegen würden. Auch arbeiten die einzelnen Kerne nicht nach einem festen Takt, 
sondern nur, wenn sie durch relevante Aktivität anderer Rechenkerne angeregt wer- 
den, was die Effizienz erheblich verbessert und der Arbeitsweise des Gehirns ähnelt. 
Perfekt ist diese Technik allerdings nicht. So kann der TrueNorth-Chip ein künstliches 
neuronales Netzwerk nicht trainieren, sondern ist dabei auf klassische Hardware 
angewiesen (Honey 2018). Auch können wegen der deutlich abweichenden Hard- 
ware nicht alle Softwarewerkzeuge benutzt werden, welche sich in der Zwischenzeit 
etabliert haben. Nichtsdestotrotz sind erste Ergebnisse zu neuromorpher Hardware 
vielversprechend. Bevor es aber zu einer Verdrängung der zurzeit dominierenden KI- 
Hardware auf Basis von Grafikprozessoren und zum Teil ASICs kommt, müssen 
sicherlich noch einige Jahre Entwicklungsarbeit investiert werden. Unerwartete 
Effekte, wie zum Beispiel die aktuelle Knappheit und der erhebliche Preisanstieg bei 
Grafikprozessoren durch den Boom von Kryptowährungen wie Bitcoin und Ethereum 
können die Geschwindigkeit der Entwicklung jedoch durchaus beeinflussen. 


Betrachtet man die aktuellen Marktteilnehmer und die sich abzeichnenden Entwick- 
lungen im Bereich der Hardware für Kl-Anwendungen, so wird deutlich, dass Know- 
how und Gewinne sich gegenwärtig in den USA konzentrieren und zusätzliche 
Akteure in China sichtbar werden. Kommerzielle deutsche Angebote finden sich 
gegenwärtig nicht. Dies ist eigentlich verwunderlich, denn in Deutschland sind mit 
der Automobilindustrie und dem Maschinen- und Anlagenbau vielversprechende KI- 
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Anwenderbranchen stark verankert. Branchengrößen wie Bosch und Continental 
setzen beispielsweise aktuell auf Chips von Nvidia. In der Grundlagenforschung zeigt 
sich hingegen ein anderes Bild. An der Universität Heidelberg etwa hat die Gruppe 
um den Physiker Karlheinz Meier den neuromorphen Hochleistungscomputer Brain- 
Scales entworfen und realisiert, der vier Millionen Neuronen mit einer Milliarde Syn- 
apsen in Hardware abbildet (Kerstin Sonnabend 2016; Schiermeier und Abbott 
2016). Dieser Computer wird genutzt, um im Rahmen des Human Brain Projects der 
Europäischen Union (Human Brain Project) Vorgänge im Gehirn zu simulieren. 
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2. Normen und Standards in der KI 


Axel Mangelsdorf 


Es gibt immer mehr Anwendungen für Kl - von optischer Erkennung, Daten- 
analyse und -manipulation über Chat-Bots bis zu virtueller Realität. Mit der 
steigenden Anzahl von Kl-Anwendungen in Unternehmen und dem immer 
größeren Nutzen für Verbraucher entsteht gleichzeitig eine Anzahl von neuen 
Herausforderungen. Dazu zählen Fragen der Interoperabilität der Systeme, 
Best Practices für den Einsatz von KI sowie Vertrauen und Sicherheit. Normen 
und Standards können einen wichtigen Beitrag dabei leisten, die wirtschaftli- 
che Entwicklung der KI zu fördern und zugleich Vertrauen und Akzeptanz bei 
Mitarbeitern und Kunden zu stärken. 


Für die Kl-Anwendung sind Sicherheits- und Qualitätsnormen unerlässlich, da sie das 
Vertrauen in neue Technologien stärken, Kaufentscheidungen vereinfachen und 
damit die Markteinführung beschleunigen (Blind 2009). Normen funktionieren darü- 
ber hinaus als Katalysator für Innovationen, indem sie die Verbreitung von technolo- 
gischem Wissen fördern, zur Erschließung neuer Märkte beitragen oder diese gar 
erst entstehen lassen. Die Entstehung von Normen und Standards ist jedoch ein kom- 
plexer Prozess, in den sich Unternehmen und auch andere interessierte Kreise wie 
Verbraucherorganisationen aktiv in technischen Komitees von Normungsorganisatio- 
nen oder der Konsortialstandardisierung einbringen müssen. Für den Bereich der KI 
haben nationale und internationale Normungsorganisationen sowie informelle Stan- 
dardisierungskonsortien den Bedarf nach Normen und Standards bereits erkannt, die 
KI-Normung steht jedoch noch am Anfang. 


Dieser Beitrag gibt Auskunft, welche Normungsorganisationen, Standardisierungs- 
konsortien und technische Komitees sich zurzeit aktiv mit dem Thema KI beschäfti- 
gen und welche Normen und Standards dort gesetzt werden. Zudem wird gezeigt, 
welche Normen und Standards es im Bereich KI aktuell gibt und welche Probleme 
diese Standards lösen. Schließlich werden mögliche künftige Handlungsräume erör- 
tert und analysiert, welche Folgen die KI künftig für die Normungsarbeit selbst haben 
kann. 


KI-Normen und Normungsinitiativen 


Zwischen formellen Normungsorganisationen und informellen Standardisierungs- 
konsortien gilt es zu unterscheiden: Formelle Normungsorganisationen entwickeln in 
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offenen, transparenten und auf Konsens angelegten Prozessen formelle Normen 
oder de jure-Standards, während informelle Standardisierungskonsortien de facto- 
Standards entwickeln. De facto-Standards entstehen durch Marktprozesse oder als 
Ergebnisse der konsortialen Standardisierung (Blind und Brock 2018). Formelle Nor- 
men haben im Vergleich zu informellen Standards eine oft höhere Qualität und 
besonders im Europäischen Binnenmarkt eine höhere Legitimität (Belleflamme 2002, 
Leiponen 2008). Formelle Normungsorganisationen sind zum Beispiel das Deutsche 
Institut für Normung (DIN) und die International Organization for Standardization 
(ISO). Zum Bereich der konsortialen Standardisierung zählen das amerikanische Insti- 
tute of Electrical and Electronics Engineers Standards Association (IEEE-SA) oder der 
Zusammenschluss der großen US-amerikanischen IT-Unternehmen unter der Initia- 
tive Partnership on Artificial Intelligence to Benefit People and Society (Partnership on 
A). 


Normen lassen sich als Innovationsindikatoren heranziehen (Grupp et al. 2002). 
Neben den oben genannten Aspekten sind vor allem Interoperabilitäts-Normen in 
Industrien wichtig, die durch kurze Innovationszyklen gekennzeichnet sind. In diesen 
Industrien können Normen die Marktentwicklung von Produkten fördern oder gar 
erst entstehen lassen. Deshalb sind Normen nicht nur als nachgelagerte Indikatoren 
zu betrachten, sondern nehmen eher eine Katalysatorfunktion im Innovationspro- 
zess ein (Blind 2009). 


Mit Hilfe einer Datenbankabfrage in der Normendatenbank PERINORM? lassen sich 
KI-Normen recherchieren. So lassen sich etwa alle Normen finden, die die Begriffe 
„Artificial Intelligence” entweder im Titel oder im Abstract der Norm aufführen. Die 
Ergebnisse einer solchen Recherche zeigen, dass bis zum Jahr 2016 vor allem inter- 
nationale Normen mit terminologischem Charakter entwickelt und in nationale Nor- 
menwerke übernommen, d. h. international verbreitet wurden. 


Eine Norm für die Definition von Kl-Terminologien ist die „ISO/IEC 2382:2015: Infor- 
mation technology — Vocabulary“. Entwickelt hat sie das gemeinsame ISO/IEC tech- 
nische Komitee „Informationstechnologie“. Die Terminologienorm fasst IT-bezogene 
Definitionen zusammen, die zuvor in mehr als 30 Normen verteilt waren. Die Norm 
ISO/IEC 2382:2015 wurde von den formellen Normungsorganisationen in Tsche- 
chien, Deutschland, Frankreich, Japan, Litauen, Polen, der Türkei und den USA in 
nationale Normenwerke übernommen. Im Deutschen Institut für Normung wurde 
im Januar 2018 ein nationales Spiegelgremium zum ISO Subkomitee ISO/IEC JTC 1/ 
SC 42 gebildet. Der Normenausschuss NA 043-01-42 AA „Künstliche Intelligenz“ 
wird aus dem Normenausschuss Informationstechnik und Anwendungen (NIA) her- 


7 Siehe www.perinorm.com, zuletzt geprüft am 26.06.2018 
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aus gegründet mit dem Ziel, deutsche Interessen auf der ISO Ebene angemessen zu 
berücksichtigen. Im Bereich der elektrotechnischen Normung, die in Deutschland 
durch die Deutsche Kommission Elektrotechnik Elektronik Informationstechnik in DIN 
und VDE (DKE) getragen wird, wurde mit der VDI-Richtlinie: VDI/VDE 3550 Blatt 1 
„Computational Intelligence - Künstliche Neuronale Netze in der Automatisierungs- 
technik” eine einheitliche begriffliche Basis für die Verwendung der maßgeblichen 
Begriffe im industriellen Einsatz entwickelt. AK 801.0.8 befasst sich mit der Spezifi- 
kation und dem Entwurf autonomer/kognitiver Systeme. Der Verband und Deutsche 
Kommission Elektrotechnik Elektronik Informationstechnik (VDE/DKE) ist zusammen 
mit neun weiteren nationalen und internationalen Normungsorganisationen aus 
Österreich, Großbritannien, China, U.S.A., Irland und der Türkei Gründungsmitglied 
des weltweiten „Forums Open Community for Ethics in Autonomous and Intelligent 
Systems” (kurz: OCEANIS), das sich mit ethischen Fragen rund um autonome und 
intelligente Systeme auseinandersetzt. OCEANIS beabsichtig, Informationen austau- 
schen und sich zu ihren jeweiligen Initiativen und Programmen hinsichtlich ethischer 
Standardentwicklung abzustimmen, gemeinsame Veranstaltungen zu organisieren 
und die Möglichkeit für abgestimmte Aktivitäten aufzuzeigen. 


Neben der genannten Terminologienorm ISO/IEC 2382:2015 berühren weitere 
ISO/IEC-Aktivitäten das Thema Kl. Das Subkomitee 7 (SC 7) des „ISO JTC 1 Software 
and systems engineering” produziert zum Beispiel horizontale Softwarenormen für 
Prozessmodelle und Best Practices. Das „SO Technische Komitee 299 Robotics” 
entwickelt u. a. Sicherheitsnormen für industrielle (ISO 10218:2012) und nicht- 
industrielle (ISO 13482:2014) Roboter. Im Europäischen Binnenmarkt hat die Norm 
EN ISO 13482:2014 im Zusammenspiel mit dem New Legislative Framework einen 
gesetzlichen Charakter, da sie als Harmonisierte Norm im Amtsblatt der Europäi- 
schen Union veröffentlicht wurde. Mit einer Einhaltung der Anforderungen der EN 
ISO 13482:2014 tritt die sogenannte Vermutungswirkung in Kraft. Das bedeutet, 
dass mit der Anwendung der Norm gleichzeitig die Anforderungen der EU-Maschi- 
nenrichtlinie (2006/42/EG) erfüllt werden und Hersteller oder Importeure das Produkt 
auf den Markt bringen dürfen (Egan 2002). Bei ISO wird das Thema KI seit 2017 in 
einem neuen Subkomitee ISO/IEC JTC 1/SC 42 Artificial Intelligence bearbeitet. Das 
ISO Subkomitee beschäftigt sich mit Normung im Bereich der KI und berät das JTC 1, 
IEC und ISO zum Thema Entwicklung von Kl-Anwendungen. Dem Subkomitee gehö- 
ren Vertreter von nationalen Normungsorganisationen aus Österreich, Kanada, Finn- 
land, Deutschland, Irland, Italien, der Schweiz und den USA an. Nicht stimmberech- 
tigte Mitglieder (Observing Members) sind Dänemark und Schweden. Den Sekretari- 
atsvorsitz des Subkomitees hat ein Vertreter des American National Standards 
Institute (ANSI) inne, den Stellvertretenden Vorsitz ein Vertreter des chinesischen 
Normunggsinstituts. Bisher wurden von ISO/IEC JTC 1/SC 42 keine Normen veröffent- 
licht. 
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Die ITU-T (ITU Telecommunication Standardization Sector) ist diejenige Abteilung 
innerhalb der ITU, die in technischen Komitee Standards — die bei ITU-T Recs bzw. 
Recommendations (Empfehlungen) genannt werden - auf dem Gebiet der Telekom- 
munikation erarbeitet. ITU-T Recs sind freiwillig in der Anwendung, werden jedoch 
häufig in nationale Gesetzgebungen integriert. Die bisher veröffentlichten Empfeh- 
lungen behandeln inhaltlich beispielsweise die Internet Netzwerkarchitektur von 
Breitband DSL bis zu Next Generation Networks. Technische Arbeitsgruppen werden 
bei ITU Study Groups genannt und veröffentlichen Arbeitsprogramme, in denen die 
Themen der kommenden Jahre festgelegt werden. Die „Study Group 20 Internet of 
things (loT) and smart cities and communities (SC&C)" hat das Thema KI im Portfolio. 
Unter dem Titel „Artificial Intelligence and Internet of Things” wird derzeit in einem 
technischen Report analysiert, welche Interoperabilitätsfragen sich aus dem Zusam- 
menspiel von KI und loT im Smart City Kontext ergeben und welche Standardisie- 
rungsaktivitäten ITU-T beginnen sollte. 


KI-Standards und Standardisierungsinitiativen 


Ein Blick auf Kl-Innovationsindikatoren (KI entwickelnde Unternehmen, Patenanmel- 
dungen) zeigt, dass amerikanische Unternehmen das Technologiefeld KI stark domi- 
nieren. Von den ca. 260 weltweit tätigen Unternehmen, die sich eindeutig mit der 
Entwicklung von KI beschäftigen, sind mehr als zwei Drittel in den USA tätig. Ebenso 
haben die meisten Anmelder von Kl-Patenten ihren Wohnsitz in den USA (IPlytics 
2018). Das amerikanische Standardisierungsinstitut IEEE-SA ist bei der Erstellung von 
Kl-Standards und bei Kl-Standardinitiativen entsprechend ebenfalls Vorreiter. 


Das Standardisierungsinstitut IEEE-SA hat mit der IEEE 1232-2010 „Artificial Intelli- 
gence Exchange and Service Tie to All Test Environments (Al-ESTATE)” einen Stan- 
dard für die Fehler- und Systemdiagnose in Testumgebungen komplexer Systeme 
entwickelt. In komplexen Systemen wie z. B. im Flugzeugbau werden immer häufiger 
Techniken und Algorithmen der KI zur Fehler- und Systemdiagnose eingesetzt. Inner- 
halb dieser Algorithmen leiten Programme (sogenannte Inferenzmaschinen) Schluss- 
folgerungen über neues Wissen ab, die zur Lösung eines Problems führen. Der Stan- 
dard IEEE 1232-2010 definiert Schnittstellen sowie Datenaustauschformate zwischen 
den Inferenzmaschinen, den Nutzern der Diagnosealgorithmen sowie angebunde- 
nen Datenbanken. 


Die Norm IEEE 1232-2010 entwickelte die Institute of Electrical and Electronics Engi- 
neers Standards Association (IEEE-SA) im „IEEE Standards Coordinating Committee 
20 (SCC 20) on Test and Diagnosis for Electronic Systems”, und das Technische Komi- 
tee 91 „Electronics assembly technology” der Internationalen Elektrotechnischen 
Kommission überführte sie in eine internationale Norm. Diese wurde ins nationale 
Normenwerk von Großbritannien, den Niederlanden und Polen übernommen. 
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Das Standardisierungsinstitut IEEE-SA hat im Jahr 2016 die IEEE-Initiative für ethi- 
sche Betrachtungen in Kl und autonomen System „IEEE Global Initiative for Ethical 
Considerations in Artificial Intelligence (Al) and Autonomous Systems (AS)” gegrün- 
det (IEEE-SA 2018). Die Initiative hat zum Ziel, das Vertrauen in KI zu erhöhen und 
schneller zu verbreiten. IEEE-SA veröffentlicht eine Guideline für Ethically Aligned 
Design, in der internationale Experten für Kl, Robotik, Recht und Politik Empfehlun- 
gen für die Entwicklung von KlI-Technologien geben. Zum Beispiel empfehlen sie, 
KI-Systeme so transparent zu gestalten, dass eine Evaluierung des Systems durch 
Dritte wie Regulierer oder Unfallbegutachter möglich ist. Damit soll sichergestellt 
werden, dass die Implementierung von Sicherheitsregeln und gesellschaftlichen 
Normen in KlI-Systeme überprüft werden kann. In der IEEE Initiative gibt es bisher 
zehn spezifische Normenprojekte. Im Folgenden werden drei der zehn Projekte kurz 
vorgestellt. 


Im Normenprojekt „Model Process for Addressing Ethical Concerns During System 
Design” wird eine Methodologie für Kl-Softwareingenieure entwickelt, die sicher- 
stellen soll, dass Anwender ethische Bedenken schon zu Beginn der Entwicklung 
bzw. des Softwarelebenszyklus analysieren und implementieren. Das IEEE Projekt 
„ Transparency of Autonomous Systems” erarbeitet einen Guide für Entwickler von 
Autonomen Systemen, mit dessen Hilfe während des Entwicklungsprozesses die 
Transparenz des Systems bewertet werden kann. Transparenz bedeutet hier, dass 
die Benutzer von Pflegerobotern zum Beispiel jederzeit eine Begründung dafür ver- 
langen können, warum das System diese oder jene Entscheidung getroffen hat. 
Transparenz bedeutet für das IEEE Projekt ebenfalls die Rückverfolgbarkeit von 
Unfällen. Das System muss interne Prozesse offenlegen, die zum Unfall geführt 
haben. Zum Beispiel sollen Entwickler analog zur Aufzeichnung von Daten in Flug- 
schreibern (Black Box) gewährleisten, dass interne Daten und Sensordaten sicher 
gespeichert werden. Die Transparenz von Autonomen Systemen soll gesellschaftli- 
ches Vertrauen in disruptive Technologien wie fahrerlose Autos erhöhen. Das IEEE 
Projekt „Ontological Standard for Ethically Driven Robotics and Automation Sys- 
tems” zielt darauf ab, einen ontologischen Standard zu entwickeln, mit dessen 
Hilfe die ethische und moralphilosophische Sprache und Theorie auf der einen 
Seite mit der ingenieurwissenschaftlichen Sprache auf der anderen Seite harmoni- 
siert. 


Neben dem Standardisierungsinstitut IEEE-SA haben die großen amerikanischen IT- 
Unternehmen im Jahr 2016 ein Konsortium gegründet, das zum Ziel hat, für besseres 
Verständnis von KI in der Öffentlichkeit zu sorgen. Dem Konsortium „Partnership on 
Artificial Intelligence to Benefit People and Society“ gehören die Unternehmen Ama- 
zon, DeepMind/Google, Facebook, IBM und Microsoft an. Etwa ein Jahr später trat 
auch Apple der Initiative bei. Deutsche Partner in der Gruppierung sind das Fraunho- 
fer Institut für Arbeitswirtschaft und Organisation (IAO), SAP und Zalando. Das Kon- 
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sortium will u.a. Industriestandards für Kl-Anwendungen schaffen. Thematisch nennt 
die Gruppierung Bereiche wie Ethik, Transparenz, Sicherheit und Interoperabilität 
oder die Vertrauenswürdigkeit und Zuverlässigkeit der Kl-Technologie (Partnership on 
Al 2018). Bisher wurden jedoch noch keine Industriestandards oder Best Practices 
veröffentlicht. Ebenfalls ist unklar, ob die Gruppierung Industriestandards über die 
Partnership on Al veröffentlicht oder ob die Unternehmen in technischen Gremien 
von ITU an internationalen Standards mitarbeiten. Schließlich sind Unternehmen wie 
Google auch in ITU Mitglieder. 


Handlungsräume 


Die Normung und Standardisierung für die Kl steht noch am Anfang. Im Vergleich zu 
anderen Innovationsindikatoren (Anzahl der Kl-Unternehmen, Patente, wissenschaft- 
liche Veröffentlichungen) gibt es noch wenige Normen und Standards. Gleichzeitig 
steigen mit der Anzahl von Produkten und Anwendungen, die Kl einsetzen, auch die 
Bedenken der Anwender und Verbraucher. Eine repräsentative Umfrage des Bran- 
chenverbandes Bitkom (Bitkom 2017) zeigt beispielsweise, dass eine Mehrheit der 
Bundesbürgerinnen und Bundesbürger befürchtet, dass der Einsatz von Kl zu Macht- 
missbrauch und Manipulation führen kann. Die international am meisten verbreitete 
Norm ist eine Terminologienorm. Normen, die dem Nutzer von Kl-Anwendungen 
Sicherheit garantieren, ethische Normen für Kl-Algorithmen und Normen für die pri- 
vate Datensicherheit von Kl-Anwendungen fehlen bisher weitgehend. Vor diesem 
Hintergrund lässt sich ein Normungs- und Standardisierungsbedarf für folgende 
Aspekte benennen. 


1. Terminologie: Normen für die Definition von KlI-Begriffen schaffen eine gemein- 
same technische Sprache. Besonders internationale Normen verhindern nationale 
Insellösungen und reduzieren Handelshemmnisse. 


2. Interoperabilität: Normen für Interoperabilität oder Schnittstellenstandards ermög- 
lichen, dass verschiedene KI-Systeme zusammenarbeiten können und damit Netz- 
werkeffekte realisieren. Interoperabilität verringert Abhängigkeit von einzelnen 
Komponenten und Systemen und steigert die Produktvielfalt. 


3. Sicherheit und Qualität: Normen für Sicherheit und Qualität erhöhen die Transpa- 
renz und Akzeptanz von Kl-Technologien bei Verbrauchern. Dadurch werden 
Transaktionskosten gesenkt. Sicherheits- und Qualitätsstandards bilden oft die 
Grundlage für eine Zertifizierung durch Dritte. Im Zusammenspiel mit verpflichten- 
den Regulierungen können Sicherheits- und Qualitätsstandards de facto rechtsver- 
bindlichen Charakter bekommen. 


4. Ethische Standards: Nach Einschätzung von Bitkom (Bitkom 2017) und PwC (PwC 
2017) ist die Formulierung von ethischen Standards fundamental für die Realisie- 
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rung von KI als Wachstumstreiber. KI ist nicht nur eine technologische Weiterent- 
wicklung, denn Kl hat auch das Potenzial, das Selbstbild des Menschen gegenüber 
Maschinen, das soziale Gefüge und die politische Meinungsbildung radikal zu ver- 
ändern. Ethische Standards müssen deshalb sicherstellen, dass Kl-Systeme und 
Algorithmen menschengerecht gestaltet werden. Um Handelsbarrieren zu verhin- 
dern, sind internationale Lösungen anzustreben. 


Ausblick 


Derzeit lässt sich noch nicht mit Sicherheit abschätzen, wie Normung und Standardi- 
sierung der Kl in den nächsten Jahren aussehen werden. Vorstellbar sind Szenarien, 
in denen einzelne führende KlI-Unternehmen Industriestandards einführen (beispiels- 
weise über die „Partnership on Al”), die sich am Markt durchsetzen. Da sich die KI- 
Industrie geographisch derzeit stark in den USA konzentriert, ist es auch ein wahr- 
scheinliches Szenario, dass amerikanische Normungsorganisationen im Vorteil sind, 
da hier die relevanten Expertinnen und Experten in großer Zahl vorhanden sind, die 
sich in den Normungsgremien beteiligen und die Inhalte der Normen definieren. 
Dieses Szenario ist umso wahrscheinlicher, als die in den USA ansässige Normungs- 
organisation IEEE-SA einen Vorsprung beim Thema KI hat. 


Normen und Standards haben nicht nur einen Einfluss auf die Entwicklung der KI, 
sondern die Digitalisierung im Allgemeinen, und die KI im Speziellen hat umgekehrt 
ebenso einen zunehmenden Einfluss auf die Normungsarbeit. Digitale Techniken, 
wie Webkonferenzen, werden immer häufiger verwendet, um die Hürden gerade für 
kleine und mittlere Unternehmen, sich an der Normung zu beteiligen, zu senken und 
somit eine breitere Beteiligung aller relevanten Parteien sicherzustellen. Normen und 
Standarddokumente in elektronischer Form bzw. maschinenlesbare und verarbeit- 
bare Normeninhalte erlauben eine schnellere Anwendung von Normen, eine einfa- 
chere Identifizierung von Schnittstellen und damit eine einfachere und effizientere 
Nutzung (Birner et al. 2017). Software-Algorithmen simulieren schon heute das Ver- 
halten von technischen Komponenten, und die Ergebnisse solcher Simulationen 
gehen in die Normungsarbeit ein. Zukünftig können Kl-unterstützte Algorithmen die 
Spezifikationen der Algorithmen selbst verändern, was den Normungsprozess 
beschleunigen könnte. Normungsorganisationen werden mit der Frage konfrontiert, 
welche Art von Algorithmen (Baysianisch, Regression etc.), Daten und Computer 
verwendet werden. Genieren KlI-Algorithmen eigenständig neue Technologien, wird 
auch die Frage nach den intellektuellen Eigentumsrechten aufgeworfen. Da nur 
Menschen und keine Maschinen Besitzer von solchen Schutzrechten sein können, 
unterliegen Kl-generierte Technologien auch keinem Patentschutz. Werden KlI-gene- 
rierte Technologien in die Normung eingebracht, lassen sich ohne Patentschutz auch 
keine Lizenzeinnahmen erzielen (Alderman und Newman 2018). 
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Der Normungsprozess ist vereinfacht als ein Entscheidungsbaum zu verstehen. Die 
Normungsexperten wählen eine bestimmte Verzweigung und diskutieren anschlie- 
Bend, welche Verzweigung im Entscheidungsbaum sie als nächstes wählen. Diese 
Vorgehensweise ist zeitintensiv und benötigt Ingenieurswissen und -kapazitäten. 
Hypothetisch ist somit auch vorstellbar, dass die KI den Normungsprozess beschleu- 
nigt, indem Algorithmen die Entscheidungsfindung übernehmen. Unternehmen in 
der Normung könnten zukünftig ihre Parameter und Ziele in Kl-unterstützte Algorith- 
men eingeben und den optimalen Pfad errechnen, Grafiken erstellen und den Text 
des Standards schreiben (Alderman und Newman 2018). Dies wäre allerdings ein 
Szenario, denn ohne die Mitwirkung von Menschen in den Normungsprozessen 
ginge den Unternehmen eine wichtige Quelle für den Austausch technologischen 
Wissens verloren. Denn besonders für kleine und mittlere Unternehmen (KMU) ist 
der Wissenstransfer durch die Beobachtung von Wettbewerbern und die nicht-doku- 
mentierten Gespräche in den Gremien ein wichtiges Motiv, um an der Normung 
teilzunehmen (Blind und Mangelsdorf 2016). 
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3. Augmented Intelligence - 
Wie Menschen mit KI zusammen arbeiten 


Moritz Kirste 


Kl-Technologien gelten in vielen Bereichen als bahnbrechend, da sie die kog- 
nitiven Leistungen des Menschen reproduzieren oder sogar übertreffen kön- 
nen. Menschliche Leistungen ließen sich somit durch KI ersetzen. Die For- 
schung im Bereich der Augmented Intelligence als Ergänzung zur KI geht 
jedoch davon aus, das sich menschliche und computergesteuerte kognitive 
Technologien im Idealfall positiv ergänzen. In diesem Beitrag wird die Motiva- 
tion hinter der Forschung zur Augmented Intelligence erläutert und einige 
vielversprechende Ansätze ausgeführt. 


Wofür haben Menschen Computer und Geräte wie Smartphones oder Tablets 
gebaut? Eine Antwort auf diese Frage lässt sich bei einem der ersten Computerpio- 
niere, Konrad Zuse, in seinem autobiografischen Werk „Der Computer — Mein 
Lebenswerk” nachlesen: „Eine ausgesprochene Abneigung hatte ich gegen die sta- 
tischen Rechnungen, mit denen man uns Bauingenieurstudenten quälte. Die Profes- 
soren, die diese Rechnerei beherrschten, bewunderte ich wie Halbgötter aus einer 
anderen Welt. Würde ich das jemals begreifen? Später sollte ich über das Problem 
des statischen Rechnens auf die Idee der programmgesteuerten Rechenmaschine 
kommen.” (vgl. Zuse 1999, Springer 100 Jahre Zuse). Demnach wurde Zuse beim 
Bau seiner ersten Rechenmaschine davon motiviert, dass diese Maschine ihm intel- 
lektuell durchaus anspruchsvolle, aber lästige Denkarbeiten abnehmen sollte. 


Es ist davon auszugehen, dass Zuse die so gewonnene Freiheit dafür nutzen wollte, 
Überlegungen nachzugehen, die ihm interessanter erschienen, während die Maschine 
die niederen Rechenaufgaben erledigte. Er dachte dabei auch schon an weiterfüh- 
rende Anwendungen, die über ein solches bloßes Berechnen, das im Grunde ver- 
gleichbar wäre mit einem besonders effektiven Abakus, hinausgingen: „Aber Zuse 
machte uns klar, daß Rechnen nur ein Spezialfall logischer Operationen ist und daß 
sein Apparat auch Schach spielen können müsse. Auch andere Anwendungsmög- 
lichkeiten, wie Wettervorhersage, ...” (vgl. Zuse 1999, Springer 100 Jahre Zuse). Den- 
noch wurden Computer lange Zeit hauptsächlich auf diese Weise eingesetzt, wie es 
die englische Bezeichnung „number cruncher” (Zahlenschieber) nahelegt. Beispiels- 
weise wurde ENIAC (Electronic Numerical Integrator and Computer), der erste rein 
elektronische Universalrechner, für die Berechnung von ballistischen Tabellen für die 
US-Armee entwickelt. Aber auch die anderen ersten Rechenautomaten, sogenannte 
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Berechner - das Wort Computer stammt vom lateinischen Wort für berechnen (com- 
putare) - wurden hauptsächlich in Bereichen eingesetzt, in denen die menschlichen 
Berechnungen zu aufwendig, schwierig oder langwierig waren wie Kryptografie, 
Wettervorhersagen, Simulationen von Atombombenexplosionen oder die Flugbahn 
von Raketen. Für die Programmierung und Steuerung dieser riesigen Rechenmaschi- 
nen wurden Lochkarten, Drehschalter und allererste Tastaturen genutzt. Was diese 
ersten Rechenautomaten jedoch nicht hatten, war etwas, das in unserer heutigen 
Nutzung aller elektronischen Geräte zentral ist: eine direktes Interface, also eine 
Steuerung mit einer visuellen oder sogar haptischen Bedienoberfläche. 


Ohne ein Interface kann ein Computer nur in einem aufeinanderfolgenden stetigen 
Ablauf von Eingabe und Ausgabe genutzt werden. Heute werden Computer natür- 
lich grundsätzlich anders genutzt. Es gibt beispielsweise eine Desktopoberfläche, die 
mit Maus und Tastatur gesteuert wird, beim Smartphone oder Tablet geschieht dies 
über Berührung, während die Auswirkungen direkt am Bildschirm sichtbar werden. 
Aber in vielerlei Hinsicht hat sich an der Nutzung ein Grundprinzip kaum verändert: 
Menschen benutzen die heutigen Geräte des Informationszeitalters als eine Form des 
kognitiven Outsourcings (Nielsen 2016), indem sie ein Problem oder eine Frage an 
das Gerät formulieren, das diese Problemstellung verarbeitet und eine Lösung prä- 
sentiert. Das geschieht in der Regel zwar über modernste Interfaces, die an das 
jeweilige Endgerät angepasst sind, der kognitiver Beitrag bleibt dabei jedoch häufig 
begrenzt und wird in einigen Fällen sogar aktiv beschränkt, um möglichst gleiche 
Ergebnisse zu erhalten. Ein Beispiel dafür ist die Wegfindung mit Hilfe eines Karten- 
dienstes wie Google Maps oder Apple Maps. Der menschliche Nutzer fragt das Com- 
puterprogramm lediglich nach dem schnellsten Weg, ohne dass eine Rücksprache 
zur genaueren Intention stattfindet. In der Intention für den Weg könnten aber wich- 
tige Informationen verborgen liegen, welche den idealen Weg beeinflussen. Es wäre 
beispielsweise denkbar, dass der Nutzer den Weg gerne mit einem ausgedehnten 
Spaziergang verbinden würde und insofern nicht am schnellsten, sondern ange- 
nehmsten Ergebnis interessiert ist. 


Die aktuellen Debatten und Entwicklungen im Bereich der KI gehen häufig sogar 
noch einen Schritt weiter, denn vielfach wird davon ausgegangen, dass sich die kog- 
nitiven Leistungen des Menschen reproduzieren oder sogar ersetzen lassen. In die- 
sem Sinne lesen sich die Meilensteine, an denen KI menschliche Leistungen übertrof- 
fen hat, als eine Geschichte des Sieges der KI über den Menschen und nicht als ein 
Versuch, die menschlichen Leistungen durch Computer zu verbessern: Schach 1997 
(Campbell et al. 2002), Jeopardy 2011 (IBM 2010), Atari Computerspiele 2013 (Mnih 
et al.), Bilderkennung 2015 (He et al.), Spracherkennung 2015 (Amodei et al.) und 
Go 2016 (Silver et al. 2017). Ohne in die Debatte über die ethischen und gesell- 
schaftlichen Konsequenzen dieser Entwicklung einzusteigen (siehe Teil C, Beitrag 12), 
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drängt sich jedoch die zu Beginn formulierte Frage erneut auf: Wozu wollen Men- 
schen Computer wirklich nutzen? 


Intelligence Augmentation 


Die Frage führt zurück auf einen Artikel von Douglas Engelbart (1962), „Augmenting 
Human Intellect: A Conceptual Framework”. In seiner Vorstellung sollten Computer 
genutzt werden, die menschlichen Fähigkeiten zur Problemlösung zu verbessern. 
Engelbart war nicht nur der Erfinder der Computermaus, sondern seine Ideen sind 
bis heute sehr einflussreich im Bereich der Informatik, der Mensch-Maschine-Interak- 
tion und der KI. Er prägte den Begriff der „Intelligence Augmentation” — augmenta- 
tion lässt sich in diesem Falle mit Vergrößerung, Steigerung oder Erweiterung über- 
setzen - im Gegensatz zur „Artificial Intelligence”, also Kl. Die Idee geht davon aus, 
dass neue Konzepte der gemeinsamen Lösungsfindung von Mensch und Maschine 
gefunden werden müssen, die als Augmented Intelligence (Augmentierte Intelli- 
genz), Intelligence Augmentation oder Artificial Intelligence Augmentation bezeich- 
net werden (Carter und Nielsen 2017). Die Intelligenz von Mensch und Maschine 
wird dabei synergetisch zur effizienteren Lösungsfindung eingesetzt. Der Vorteil die- 
ser Synergie besteht darin, dass KI den Menschen nicht ersetzt, sondern ergänzt (IBM 
2018). Gleichzeitig sind solche Systeme nur dann erfolgreich, wenn Mensch und KI 
über eine gemeinsame Sprache oder ein gemeinsames Dialogsystem verfügen, wel- 
ches durch ein für alle Nutzer geeignetes Interface realisiert wird. Ein Nutzer muss in 
der Lage sein, Entscheidungen der KI vor ihrer Ausführung zu prüfen, um ggf. an 
neuralgischen Stellen des Prozesses eingreifen zu können. Dafür ist die Entwicklung 
neuer Schnittstellen notwendig, die es erlauben, die kritischen Stellen zu identifizie- 
ren. Die Nutzer müssen in den Ablauf des KlI-Systems involviert sein, ohne dass ihre 
kognitive Belastung größer wird. Unter den Begriff Augmentation fallen auch physi- 
sche Systeme wie beispielsweise Brain-Computer-Interfaces, Gehirnprothesen oder 
technische Werkzeuge zur Verbesserung der menschlichen Sinne. Im Beitrag werden 
ausschließlich die softwareseitigen Ansätze betrachtet, die an der Schnittstelle zwi- 
schen Augmented Intelligence und KI liegen. 


Wie lässt sich Augmentierte Intelligenz vorstellen und wie lässt sie sich umsetzen? Ein 
einfaches Beispiel, von Carter und Nielsen (2017) übernommen, dient hier als Illust- 
ration: Das geometrische Gebilde eines Kreises lässt sich sowohl durch die Formel als 
auch durch die Zeichnung eines Kreises darstellen. Welche Darstellung ist besser? 
Welche enthält die wichtigen Informationen? Mit welcher kognitiven Transformation 
gelingt es uns besser, den Wesensgehalt eines Kreises zu erarbeiten, zu begreifen 
und für andere begreifbar zu machen (Nielsen 2016)? Augmentierte Intelligenz setzt 
genau an dieser Stelle an, indem sie uns dabei unterstützt, die jeweils passende kog- 
nitive Transformation und Repräsentation zu finden. Sie unterstützt auf diese Weise, 
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den Inhalt unserer Gedanken selbst auf eine geeignete Metaebene zu transformieren 
und somit wiederum neue Erkenntnisse zu erlangen. 


Interaktives maschinelles Lernen 


Ein Ansatz für Augmented Intelligence ist das interaktive maschinelle Lernen (ML). 
Das Ziel dieses Verfahrens ist es, Menschen stärker in das jeweilige Lernverfahren des 
überwachten, unüberwachten und verstärkten Lernens einzubinden (siehe Einlei- 
tungskapitel „Entwicklungswege zur KI”). Für diese Idee eines „human-in-the-loop” 
gibt es eine Reihe von Beispielen (Amershi et al. 2014). Nutzer können dabei entwe- 
der vor oder nach einer Phase der Modellbildung durch den Lernalgorithmus einen 
gewissen Grad der Kontrolle und des Feedbacks übernehmen. Trainingsdaten kön- 
nen modifiziert werden, indem die Wichtigkeit bestimmter Merkmale hervorgeho- 
ben wird, Fehlertoleranzen können angepasst werden oder die durch den Algorith- 
mus erkannten Muster und Strukturen können als passend oder unpassend bewertet 
werden. Solche Verfahren eignen sich insbesondere für Anwendungsfälle, bei denen 
die gewünschten Ergebnisse und Ausgaben, die der Lernalgorithmus aus den Trai- 
ningsdaten ausgeben soll, im Vorhinein noch nicht bekannt sind. Die Effizienz des 
Trainingsprozesses kann durch interaktives maschinelles Lernen zwar gesteigert wer- 
den, die Nutzer empfinden den Prozess aber oft als ermüdend oder langweilig, da sie 
in erster Linie nur für eine Verbesserung des Trainings benutzt werden, dabei aber 
kaum eigene kognitive Leistungen erbringen müssen (Amershi et al. 2014). Als Folge 
dessen gewinnen sie kaum wirkliches Wissen und Erkenntnisse, über die sie nicht 
auch schon vor der Nutzung des Computersystems verfügten. 


Visual Analytics und maschinelles Lernen 


Ein weiterer und vielversprechender Ansatz für Augmented Intelligence, der einige 
der Ideen des interaktiven ML zwar beinhaltet, aber weit darüber hinaus geht, ist die 
Kombination von maschinellem Lernen mit sogenannten Visual Analytics (Endert et 
al. 2017). Dabei werden große Datenmengen durch Methoden der KI und insbeson- 
dere des ML auf visuelle Art und Weise so aufbereitet, dass Menschen aus diesen 
Daten Erkenntnisse gewinnen können. Ein bekanntes Modell für diese Erkenntnisge- 
winnung stammt von Pirolli und Card (Pirolli und Card 2005). Es beschreibt den 
Prozess, wie aus Datenquellen Erkenntnisse erzeugt werden können. Das Modell 
unterteilt den Prozess in zwei Phasen: die erste sogenannte Hamsterphase, in der die 
ursprünglichen Informationen wiederholt auf Zusammenhänge durchsucht werden, 
und die zweite sogenannte Sinnstiftungsphase, in der die Informationen in ein 
Schema, überprüfbare Hypothesen und schlussendlich in eine präsentierbare Erkennt- 
nis fließen. Systeme der Augmented Intelligence können Nutzer jetzt insbesondere in 
der Hamsterphase beim Durchforsten der Daten unterstützen. Der Nachteil an die- 
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sem Modell ist der stark lineare Charakter, der von zunächst unstrukturierten Daten 
und Wissen hin zu einer Erkenntnis führt. Zudem wird kaum erklärt, wie ein Compu- 
ter bei dieser Form der Wissensgenerierung unterstützen könnte. 


Diese Nachteile versucht das Model von Sacha et al. (Sacha et al. 2014) auszuglei- 
chen (siehe Abbildung 3.1), indem es die Benutzung eines Computersystems in den 
menschlichen Erkenntnisprozess integriert. Es dient als Basis für einen iterativen Weg, 
der auch Vorkenntnisse berücksichtigt und erkenntnistheoretische Schlussverfahren 
wie Induktion, Deduktion und Abduktion einschließt (Ribarsky und Fisher 2016). 


Computer 


Mensch 
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a HANDLUNG ee ERKENNTNIS 
i x 
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Abbildung 3.1: Das Modell von Sacha et al. zeigt die Integration eines Computersystems in 
den menschlichen Erkenntnisprozess. Wissen entsteht dabei durch wiederholte Schleifen 
innerhalb des Prozesses (eigene Darstellung adaptiert von Sacha et al. 2014). 
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Unabhängig von der Modellierung des Erkenntnisprozesses erfolgt die Umsetzung 
der Kombination von Visual Analytics und maschinellem Lernen. Hierfür orientieren 
sich die Methoden an den vier Hauptverfahren Regression, Klassifikation, Clustering 
und Dimensionsreduktion (Einleitung Teil A). Interaktive Systeme erlauben die Modi- 
fizierung der verwendeten Algorithmen durch eine Anpassung der Parameter, der 
Vergleichswerte oder der zugrundeliegenden Algorithmen selbst. Dabei können die 
Nutzerinnen und Nutzer auf einer graphischen Benutzeroberfläche Datenpunkte, 
Variablen und Parameter sehen, Datenbereiche auswählen, Algorithmen nur auf 
diese Teilbereiche anwenden und sich im Anschluss die Auswirkungen auf die analy- 
sierten Daten anschauen. Ziel ist es, das Expertenwissen und die Algorithmen in 
Einklang zu bringen und im Falle einer Abweichung den Algorithmus möglichst 
effektiv anzupassen. Ein anschauliches Beispiel für diese Verfahren stammt aus einem 
Video der Firma Enlitic (Howard 2014). Hier werden Bilder anhand eines interaktiven 
Clusterverfahrens in wenigen Minuten sortiert, indem das Computersystem dem 
Nutzer immer wieder die Ergebnisse vorführt und dieser die Wichtigkeit und Unwich- 
tigkeit bestimmter Merkmale hervorhebt. Die Zusammenarbeit erinnert an die Arbeit 
eines Forensikers, dem stets nur die relevanten Ergebnisse präsentiert werden und 
der dann darin Zusammenhänge erkennt. 


Dimensionsreduktion und GAN 


Ein Verfahren, das sich insbesondere um das Verständnis von Zusammenhängen 
bemüht, ist das der Dimensionsreduktion. Damit ist gemeint, dass ein hochdimensi- 
onaler Parameterraum durch einen kleineren Parameterraum möglichst so abgebil- 
det wird, dass dabei keine Informationen verloren gehen. Dabei sind die Variablen 
des kleineren Parameterraums lineare Kombinationen oder nicht lineare Kombinati- 
onen der ursprünglichen Variablen. Die Verwendung lässt sich am Beispiel Bilderken- 
nung anschaulich erklären. Für diese Anwendung werden Algorithmen des maschi- 
nellen Lernens, insbesondere Neuronale Netze, auf die Erkennung von Bildern trai- 
niert. So können diese Netze aus vielen Bildern sehr treffsicher beispielsweise Hunde 
oder Gesichter erkennen (Einleitung Teil A). Im Prozess wird ein Bild und somit ein 
hochdimensionaler Raum, der aus Informationen über Position und Farbwert eines 
jeden Bildpunktes besteht, durch einen kleineren Raum abgebildet, der nur die Infor- 
mation enthält, was auf dem Bild zu sehen ist. Das komplexe hochdimensionale Bild 
wird auf eine einfachere Information reduziert, die beispielsweise nur abbildet, ob es 
sich um einen Hund oder Elefanten handelt (siehe Abbildung 3.2). 


Man kann diesen Prozess auch umkehren und herausfinden, welche Merkmale eines 
Bildes denn einen Hund ausmachen oder charakterisieren, beziehungsweise aus wel- 
chen Parametern welches Hundebild entsteht. Hierfür sind insbesondere die GAN 
sehr hilfreich, da sie helfen, diejenigen Eingabeparameter zu entdecken, die ein 
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Abbildung 3.2: Dimensionsreduktion: Durch ein Neuronales Netz wird ein hochdimensionaler 
Raum, hier der Inhalt eines Bildes, auf einen kleineren Raum abgebildet (links). Bei einem 
GAN kann ein niederdimensionaler Raum der Hundemerkmale dargestellt werden, in 
welchem jeder Punkt einer bestimmten Ausprägung eines Hundes entspricht (rechts) (eigene 
Darstellung in Anlehnung an Carter und Nielsen 2017). 


bestimmtes Bild charakterisieren. Das ist anders als ein klassisches neuronales Netz, 
das nach einer Trainingsphase an bekannten Bildern ein neu zu bestimmendes Bild 
erkennen kann. Durch diese Umkehrung entsteht ein niederdimensionaler Raum der 
Hundemerkmale, in welchem jeder Punkt einer bestimmten Ausprägung eines Hun- 
des entspricht (siehe Abbildung 3.2). Welche Vorteile sich daraus für das Verständnis 
von Zusammenhängen ergeben, wird deutlich, da der weniger dimensionale Raum 
mit menschlichen Begriffen beschreibbar und für Menschen nachvollziehbar gestal- 
tet werden kann - Beinanzahl, Schwanzlänge, Haarfarbe, Maulgröße usw. — und 
eine Veränderung der Parameter in diesem Raum hat die unmittelbare Änderung des 
entsprechenden Hundebildes zur Folge. 


Wie könnte ein Interface für ein solches System aussehen? Für das Beispiel des Hun- 
debildes hieße das, eine Vielzahl von Bildern verschiedener Hunderassen zu charak- 
terisieren. Im niederdimensionalen Raum der Hundemerkmale sollten Hunde der 
gleichen Rasse jeweils in einem ähnlichen Bereich landen, während Hunde anderer 
Rassen räumlich getrennt wären (siehe Abbildung 3.3). Durch eine Verbindung - 
mathematisch wäre dies ein Vektor - zwischen dem Zentrum des einen Bereichs und 
dem Zentrum des anderen Bereiches, ergibt sich eine gute Möglichkeit, Hundemisch- 
linge zwischen diesen beiden Rassen zu charakterisieren, deren Merkmale sich ent- 
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lang dieses sogenannten Attributevektors bewegen. Ein Interface für Augmented 
Intelligence könnte nun einerseits die Dimensionsreduktion ausführen, die Bereiche 
der Gemeinsamkeiten anzeigen, Verbindungen ziehen und die Manipulation der 
Daten entlang dieser Verbindungen erlauben. Diese Idee eines Interface, welches ein 
tieferes Verständnis ermöglicht, lässt sich auch auf andere Zusammenhänge übertra- 
gen, in denen ein hochdimensionaler Datenraum, der sich von Menschen nur schwer 
durchsuchen lässt, auf einen deutlich niedrigeren Dimensionsraum abgebildet wer- 
den kann. 


Die Idee der Verbindungsvektoren ist nur eine und im Grunde auch sehr simple 
Methode, die dabei helfen kann, Zusammenhänge in den Daten zu erkennen und für 
weitere Erkenntnisse zu nutzen. Eine weitere Möglichkeit lässt sich ebenfalls anhand 
eines Beispiels illustrieren: Dabei wird eine riesige Anzahl von Kochrezepten mit 
einem GAN analysiert und auf einen niederdimensionalen Raum abgebildet. In die- 
sem Raum könnte der Schärfegrad der Gerichte ein wichtiger Parameter sein. Ein 
Nutzer kann ein bestimmtes Gericht im Kopf haben, das durch einen Punkt in diesem 
Parameterraum dargestellt wird, und einen bestimmten Schärfegrad anstreben, der 
durch eine Linie im Parameterraum wiedergegeben wird (siehe Abbildung 3.4). Ein 
Interface für Augmented Intelligence erlaubt es dem Nutzer nun, diese Linie und den 
Punkt zu bestimmen. Das System zeigt dann die kürzeste Verbindung zwischen Linie 


Abbildung 3.3: Die Abbildung veranschaulicht die Funktion eines Attributevektors, der 
zwischen dem Schwerpunkt einer Hunderasse (Labradore) in den Schwerpunkt einer anderen 
Hunderasse (Poodle) zeigt. Auf dem Vektor läge dann ein Mischling zwischen den beiden 
Rassen (Labradoodle) (eigene Darstellung in Anlehnung an Carter und Nielsen 2017). 
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SCHÄRFEGRAD 


Abbildung 3.4: Datenreduktion: Jeder Punkt im Raum entspricht einem Gericht. Der 
Schärfegrad lässt sich als Linie zwischen einem sehr scharfen (Chilli) und einem nicht 
scharfen Gericht (Gemüsesuppe) darstellen. Die Parameter des gewünschten Gerichtes 
(Pizza) können jetzt so variiert werden, dass sie einem bestimmten Schärfegrad entsprechen 
(eigene Darstellung in Anlehnung an Carter und Nielsen 2017). 


und Punkt an und welche Parameter (z. B. Zutaten und Mengen) des geplanten 
Gerichtes modifiziert werden müssen, damit sie dem gewünschten Schärfegrad ent- 
sprechen. Dieses Bewegen eines Punktes innerhalb gewisser Grenzen des niederdi- 
mensionalen Parameterraums kann ebenso wie die zuvor beschriebene Methode zu 
neuen Erkenntnissen führen, da sich die Auswirkungen im hochdimensionalen Raum 
- in diesem Fall also das modifizierte Gericht — direkt beobachten ließen. 


Sowohl die Hundebilder als auch die Kochrezepte sind natürlich sehr einfache Bei- 
spiele, von denen sich schwerlich behaupten ließe, dass ein Interface für Augmented 
Intelligence hier wirklich neue Einblicke und Erkenntnisse liefern kann. Ganz anders 
stellt sich dies in einem weiteren Szenario dar, in dem deutlich wird, welche Vorteile 
ein funktionierendes Interface, das Visual Analytics und ML kombiniert, bieten 
könnte: In einem Chemielabor arbeitet eine Chemikerin an der Untersuchung der 
möglicherweise umweltschädlichen Auswirkungen von Inhaltsstoffen in Unkrautver- 
nichtungsmitteln, die in der Landwirtschaft eingesetzt werden sollen. Für eine Ent- 
scheidungsfindung hat sie eine Vielzahl an Möglichkeiten, sie verfügt aber nur über 
begrenzte finanzielle Mittel. Außerdem muss sie die Entscheidung schnell treffen, da 
ansonsten die Zulassung des Mittels auf dem Spiel steht. Die Chemikerin kann auf 
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große Datenbanken, die Wissen über chemische Stoffe enthalten, zurückgreifen, sie 
könnte eigene Feld- und Labortest durchführen, um die Auswirkungen zu analysie- 
ren, oder sie könnte die exakte chemische Zusammensetzung des Mittels herausfin- 
den. Ein Augmented Intelligence-System soll ihr bei der Entscheidung helfen. 
Zunächst stellt das System alle bisher vorhanden Informationen visuell dar. Die Che- 
mikerin beginnt diese Informationen zu ordnen, indem sie bestimmten Inhalten grö- 
Bere Wichtigkeit zuweist als anderen (Visual Analytics). Das System passt seine Ord- 
nung mittels ML direkt an und stellt die Inhalte neu dar. Auf diese Weise erkennt die 
Chemikerin, welche Tests einen großen Informationsgewinn ermöglichen und wel- 
che Tests nur bereits bekanntes Wissen reproduzieren - hier könnte die Dimensions- 
reduktion durch ein GAN helfen. Das System macht eigene Vorschläge für sinnvolle 
Tests, indem es den zu erwartenden Erkenntnisgewinn zeigt, und adaptiert die dar- 
gestellten Inhalte und Ordnungsstruktur direkt an die neuen Ergebnisse. Ziel ist, den 
Raum aller Informationen und Kombinationsmöglichkeiten nicht komplett zu durch- 
dringen, sondern nur einen sinnvollen Pfad zu einem Ergebnis zu beschreiten. Am 
Ende wird die komplexe Fragestellung effizient und von Menschen nachvollziehbar 
beantwortet. 


Bis ein solches Szenario realisierbar ist, müssen die bisherigen Ansätze weiter erforscht 
und entwickelt werden. Ein Aspekt ist hervorzuheben - das Verständnis natürlicher 
Sprache durch Computersysteme. Dies ist deshalb so wichtig, weil Menschen ständig 
erklären, zuhören und generell kommunizieren und auf diese Weise nicht nur 
Erkenntnisse gewinnen, sondern auch (mit-)teilen. Für eine Augmented Intelligence 
ist es entscheidend, diesen Informationskanal zu verstehen und nutzen zu können. 
Wie groß die Bedeutung ist, sieht man an den aktuellen Erfolgen mit smarten Laut- 
sprechern im Consumerbereich (Statista und Brandt Mathias). Erst als sich die Kom- 
munikation mit der Kl in diesen Systemen für Menschen natürlich anfühlte, konnten 
die Systeme erfolgreich werden. Neue Entwicklungen auf diesem Gebiet deuten dar- 
auf hin, dass sich diese Systeme in den kommenden Jahren deutlich verbessern wer- 
den (Hirschberg und Manning 2015). 


KI-Akzeptanz 


Weitere Aspekte, die den Umgang mit Augmented Intelligence und KI im Allgemei- 
nen maßgeblich beeinflussen, sind Vertrauen, Verständnis und Erklärbarkeit von Ent- 
scheidungen. Es ist anzunehmen, dass die Akzeptanz von KI verbessert werden kann, 
wenn deren Analysen und Vorschläge für Menschen erklärbar und damit auch nach- 
vollziehbar sind und auf diese Weise Vertrauen schaffen. Eine allgemein verständli- 
che und nutzbare Schnittstelle für Augmented Intelligence kann dazu dienen, die 
Nachvollziehbarkeit und das Vertrauen in KI zu stärken. Die Wichtigkeit dieser 
Aspekte zeigen sich in der aktuellen DARPA Challenge (DARPA), bei der Computer- 
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systeme entwickelt werden, die solche potenziellen Fragen eines Nutzers beantwor- 
ten sollen, um zu einem besseren Verständnis zu gelangen (siehe Abbildung 3.5). 


Es stellt sich bei der Entwicklung der beschriebenen Systeme für Augmented Intelli- 
gence natürlich die Frage, ob eine Verbesserung der kognitiven Leistungen über- 
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Abbildung 3.5: Darstellung des Modells eines für Nutzende nachvollziehbaren Systems der KI 


(eigene Darstellung in Anlehnung an DARPA 2018). 
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haupt messbar ist. Und wenn ja, wie? Lässt sich eventuell eine Art Intelligenztest 
überlegen, der die Zusammenarbeit von Mensch und KI bewertet und insbesondere 
nachweist, dass diese Zusammenarbeit ungleich fruchtbarer ist, als wenn wir mensch- 
liche durch KI ersetzten? Von der Antwort auf die Frage hängt es ab, welche Com- 
putersysteme in den kommenden Jahren entwickelt werden und ob diese, um auf 
das anfängliche Zitat von Konrad Zuse zurückzukommen, uns Freiheit schaffen oder 
im schlimmsten Falle diese sogar einschränken. 
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4. Maschinelles Lernen für die IT-Sicherheit 


Katrin Gaßner 


Maschinelles Lernen (ML) kann die Werkzeuge und Verfahren verbessern, die 
in vernetzten IT-Systemen oder generell im Internet für die IT-Sicherheit genutzt 
werden. Die IT-Sicherheit birgt jedoch ganz besondere Herausforderungen für 
den Einsatz von ML. In diesem Beitrag geht es darum, wie Unternehmen 
bereits jetzt maschinelles Lernen zur Verbesserung von IT-Sicherheit nutzen 
und welchen Beitrag heute die Forschung liefert. Dort ist die Verknüpfung von 
ML und IT-Sicherheit noch verhältnismäßig rar. Das ist ein Defizit, da Lösungs- 
potenziale, die aus der Kombination der Disziplinen entstehen, zu erwarten 
sind. 


Mit dem zurzeit ganz allgemein zunehmenden Einsatz von Kl-Methoden wächst 
auch für die IT-Sicherheit die Hoffnung, dass ML-Verfahren sichere IT-Systeme ermög- 
lichen, die sich lernend auf Bedrohungen einstellen. Doch ML ist kein Allheilmittel, es 
kann das Erkennen und Bekämpfen von Angriffen auf Systeme mit IT-Komponenten 
voraussichtlich nur ergänzen. So eignet sich ML beispielsweise dazu, große Daten- 
mengen auszuwerten oder Anomalien zu erkennen. Aber es ist auch zu bedenken, 
dass ML-Verfahren selbst angreifbar und kompromittierbar sind, es können also 
sogar zusätzliche Angriffsvektoren durch die Nutzung von ML entstehen. Außerdem 
ist der Aufwand für das Trainieren der ML-Systeme hoch und ML-Verfahren sind im 
Allgemeinen sehr spezialisiert. 


ML - Lösungsansatz für die IT-Sicherheit? 


Mit der Digitalisierung bieten heute beinahe alle technischen Systeme auch Angriffs- 
flächen für Hacker, Spionage und generell für kriminelle Handlungen. Nicht zu ver- 
nachlässigen ist, dass technische Systeme immer in einem sozio-technischen Kontext 
genutzt werden und die nutzenden Menschen zu potenziellen Angreifern werden 
können, mit oder ohne Absicht. Die Angriffe erfolgen über die informationstechni- 
schen Systeme, Teilsysteme, Komponenten und Schnittstellen, die heute vielfältig 
untereinander vernetzt sind. Neben Produktions- und Industrieanlagen sind das Inf- 
rastruktureinrichtungen und Bürosysteme ebenso wie Systeme des automatisierten 
Fahrens oder Fliegens. Und im Internet of Things (IoT) werden inzwischen sogar ver- 
netzte Waschmaschinen, Kameras oder Kaffeeautomaten zu möglichen Angriffs- 
punkten. 


V. Wittpahl (Hrsg.), Künstliche Intelligenz, 
DOI 10.1007/978-3-662-58042-4_5, © Der/die Autor(en) 2019 
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Die Vielfalt der digitalen Systeme lässt die potenzielle Anzahl der Sicherheitslücken 
explodieren. Damit einher gehen die endlosen Möglichkeiten, wie und anhand wel- 
cher Indizien Bedrohungen erkannt werden können. Mit den seit Jahren zunehmen- 
den Angriffen auf IT-Systeme wuchs die Erkenntnis, dass es eine abschließende 
Sicherheit nicht geben kann. Auch ein Security by Design (Waidner et al. 2013) kann 
die Probleme nicht völlig lösen, wohl allerdings die allgemeine Gefährdungslage 
erheblich verbessern. Diese Erkenntnis ist ein wesentlicher Ausgangspunkt für den 
Bedarf am Bedarf an ML für die IT-Sicherheit. 


Angriffe ändern sich ständig. Beispielsweise modifizieren Angreifer Computerviren 
automatisch, sodass Virenscanner sie nicht mehr erkennen. Alle drei Monate werden 
schätzungsweise rund 18 Millionen neue Beispiele für Schadprogramme gefunden 
(Atos 2017, S. 32). Ziel muss es sein, Programme zu entwickeln, um Angriffe auszu- 
machen, die gerade erst vorbereitet werden, also bevor sie überhaupt Schaden 
anrichten können. Hinter welchen Daten könnte sich ein Angriff verbergen? Aller- 
dings entsteht aus einzelnen Daten im Allgemeinen kein vollständiges Bild. Es besteht 
die Hoffnung, dass mit ML entsprechende Muster zu identifizieren sind. Für die riesi- 
gen Mengen an Kommunikationsdaten werden außerdem Programme benötigt, die 
Angriffe und Risiken über Systemgrenzen hinweg erkennen können (vgl. auch Juni- 
per 2016). Generell gilt, dass der Aufwand hoch ist. 


Es ist spannend, dass die Forschung und Entwicklung für ML-Sicherheitsprodukte 
weitgehend innerhalb von Unternehmen stattzufinden scheint. Dies erschwert die 
strategische Entwicklung des Themas, da die Ergebnisse der Unternehmensforschung 
sowie die Daten und Algorithmen nicht öffentlich zur Verfügung stehen. Augenfällig 
ist, dass im Vergleich zur ML-Forschung im Allgemeinen heute nur wenige Fachkon- 
ferenzen existieren, auf denen die Verbindung von ML und IT-Sicherheit diskutiert 
wird. Eine der wenigen Ausnahmen bildet der ACM Workshop on Artificial Intelli- 
gence and Security, der seit 2008 jährlich im Rahmen der ACM Conference on Com- 
puter and Communications (CCS) ausgerichtet wird. ML ist ansonsten eher Thema 
auf sogenannten Hacker-Konferenzen wie der DEF CON®. Hinzu kommen Konferen- 
zen zur KI und ML, auf denen vereinzelt IT-Sicherheit adressiert wird. Auch auf Kon- 
ferenzen zur IT-Sicherheit taucht ML bisher eher am Rande auf. Mit dem zunehmen- 
den Bedarf an IT-Sicherheit scheint sich dies jedoch zu ändern. 2017 wurde das 
„International Symposium on Cyber Security Cryptography and Machine Learning 
(CSCML 2017)” ins Leben gerufen, das die Ben-Gurion University in Israel ausrich- 
tete, mit einer Nachfolge in 2018. Der erste DL and Security Workshop im Jahr 2018 
hat zusammen mit dem 39th IEEE Symposium on Security and Privacy stattgefunden. 


8€ httos://www.youtube.com/watch?v=wbRx18VZIYA , zuletzt geprüft am 22.06.2018 
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ML gegen Schadprogramme 


Beim Schutz von IT-Systemen besteht eine der wesentlichen Herausforderungen 
darin, neue Schadprogramme möglichst schnell abzuwehren oder sogar voraus- 
schauend zu handeln. Antivirenprogramme kombinieren dafür im Allgemeinen meh- 
rere Verfahren. Eines davon umfasst die Identifizierung und Verwaltung von Schad- 
programm-Signaturen. Signaturen sind kurze Byte-Folgen, die aus den Schadpro- 
grammen extrahiert werden?. Die Signatur-Datenbanken müssen ununterbrochen 
aktualisiert werden. „Es kommen mehr als 100.000 Signaturen von Schadsoftware 
täglich hinzu.”!°Solche Zahlen sind Schätzungen und sollen teilweise noch deutlich 
höher liegen. Basierend auf einer Analyse der AV-Test GmbH schätzt Heise.de, dass 
„täglich über 390.000 neue Schadprogramme, also über 16.000 pro Stunde bezie- 
hungsweise 4 bis 5 neue pro Sekunde” auftreten (vgl. auch BSI 2017, S. 22). 


Diese enorm hohen Zahlen ergeben sich allerdings vor allem daraus, dass Malware 
ständig „mutiert“ (polymorphe Malware). Signatur-Datenbanken verwalten aus Effi- 
zienzgründen Signaturen in Form sogenannter Hashwerte, oft in hexadezimaler Dar- 
stellung, die mit Hilfe von Hashfunktionen berechnet werden”. Geringste Änderun- 
gen eines Schadprogramms führen zu neuen Hashwerten. So entstehen immer wie- 
der ähnliche, aber nicht identische „Schädlinge“ 13, die in den Datenbanken als quasi 
neue Schädlinge trotzdem mit verwaltet werden. 


An dieser Stelle kommt ML ins Spiel: Auf Signaturen aufbauende Virenprogramme 
arbeiten oft regelbasiert. „Aufgrund ihrer Komplexität und der Anfälligkeit für eine 
verschobene Gewichtung sind regelbasierte Anti-Malware-Systeme sehr anfällig 
dafür, eine Bedrohung zu übersehen.” (Juniper 2016, S. 3). Heute versucht man, 
diese regelbasierten Ansätze mit Methoden des ML zu überlagern, um Regeln zu 
gewichten und zu optimieren (Juniper 2016, S. 4). 


Strobel (2017) erläutert einen Ansatz, den der Anbieter Cylance verfolgt. Danach 
nutzt Cylance zwar die vorgesehene Windows-Schnittstelle für Virenschutz, aber die 


°  httos://www.bsi-fuer-buerger.de/SharedDocs/Glossareintraege/DE/V/Virensignatur.html, 
zuletzt geprüft am 22.06.2018 

10 http: //www.deutschlandfunk.de/antiviren-software-neue-methoden-der-malware-erken- 
nung.684.de.htmi?dram:article_id=379868, zuletzt geprüft am 22.06.2018 

1! httos://www.heise.de/newsticker/meldung/Zahlen-bitte-Taeglich-390-000-neue-Schadpro- 
gramme-3177141.html, zuletzt geprüft am 22.06.2018 

12 https: //www.datenschutzbeauftragter-info.de/hashwerte-und-hashfunktionen-einfach- 

erklaert/, zuletzt geprüft am 22.06.2018 

https://www.heise.de/newsticker/meldung/Zahlen-bitte-Taeglich-390-000-neue-Schadpro- 

gramme-3177141.html, zuletzt geprüft am 22.06.2018 
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Malware wird nicht anhand von Signaturen erkannt. Eingesetzt wird ein mathemati- 
sches Modell, das mit Malware-Objekten und gutartigen Dateien beim Hersteller 
trainiert wurde. Der Umweg über die Signaturerkennung ist nicht mehr notwendig, 
nur das Modell muss an die Kunden ausgeliefert werden. So verlängern sich die Aus- 
lieferungszeiten. Strobel (2017) geht davon aus, dass andere Hersteller von Viren- 
schutzprogrammen Methoden der KI einsetzen, um Signaturen beim Hersteller 
schneller erzeugen zu können. Bei diesem Ansatz muss jedoch weiterhin die Signa- 
turdatenbank an die Kunden geliefert werden. 


Cohen, Hendler und Potashnik (2017) erforschen einen Ansatz, um signaturbasierte 
Schadcodeerkennung zu ergänzen. Sie nutzen Anti-Virus-Reports eines SIEM-Sys- 
tems (Security Information and Event Management), um Trainingsdaten zu generie- 
ren. Systeme, die damit trainiert werden, können automatisch komplexe und dyna- 
mische Muster im Systemverhalten besser erkennen. 


ML gegen Sicherheitslücken 


Größere Software- und Hardwaresysteme besitzen fast immer Schwachstellen (Vul- 
nerabilities). Sie entstehen z. B. durch Fehler bei der Programmierung’? oder auch 
durch unbekannte Sicherheitslücken. Bekannt ist etwa die Injektion von Schadcode 
in Datenbankanfragen, um Daten auszuspähen. „Grobe Schätzungen zeigen, dass 
ein Programmierer pro 1000 Programmzeilen einen Fehler erzeugt” .'° Sicherheitslü- 
cken erlauben beispielsweise „Zero Day Exploits”, das sind Angriffe, die am gleichen 
Tag erfolgen, an dem die Schwachstelle entdeckt wird.'%'’ Seitenkanalangriffe zielen 
z. B. auf kryptographische Systeme, indem sie durch physikalische Messungen (z. B. 
elektromagnetische Felder, Energieverbrauch) Zugriff auf sensible Daten bekom- 
men.'? Zwei der jüngsten und sehr bekannten Seitenkanalangriffe auf Computerchips 
waren Meltdown und Spectre Anfang 2018.'? Prozessoren legen aus Performance- 


R 


https://www.security-insider.de/was-ist-eine-sicherheitsluecke-a-648842/, zuletzt geprüft 
am 22.06.2018 

https://de.wikipedia.org/wiki/Sicherheitslücke , zuletzt geprüft am 22.06.2018 
https://www.kaspersky.de/resource-center/definitions/zero-day-exploit; zuletzt geprüft am 
22.06.2018 
https://www.bsi.bund.de/DE/Themen/Cyber-Sicherheit/Empfehlungen/cyberglossar/ 
Functions/glossar.html?cms_lv2=9817322, zuletzt geprüft am 22.06.2018 
https://www.bsi.bund.de/DE/Themen/Cyber-Sicherheit/Empfehlungen/cyberglossar/ 
Functions/glossar.htmi;jsessionid=AB23BDE 13869A528AA3EE8D76137BF9E.2_ 
cid341?cms_lv2=9817308, zuletzt geprüft am 22.06.2018 

19 http://www, secupedia.info/wiki/Seitenkanalangriff, zuletzt geprüft am 22.06.2018 
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gründen vorausschauend Daten im Speicher ab. Mit Meltdown wurde gezeigt, dass 
bei Intel-Prozessoren auf diese Speicherbereiche zugegriffen werden kann und die 
Daten auslesbar sind. Von Spectre sind „prinzipiell alle modernen Prozessoren 
betroffen”. Hier bekommen Prozesse Zugriff auf einen virtuellen Speicher in einem 
Adressraum, der nicht zugänglich sein sollte.” 


Um Sicherheitslücken zu finden oder auch auszunutzen, müssen Systeme, Program- 
miersprachen und Hardware bis ins Detail verstanden werden. Im Fall von Spectre 
und Meltdown haben Forscherteams eine entsprechende Lücke vorhergesagt - und 
lange geforscht, um sie zu belegen. Sicherheitslücken sind vielfältig. Solche Lücken 
sind besonders schwierig und vielleicht gar nicht durch ML-Ansätze zu finden, die 
ganz wesentlich auf der Mustererkennung und Generalsierung beruhen, wofür Trai- 
ningsdaten existieren müssen. 


Trotzdem bestehen ML-Ansätze für das Aufdecken von Sicherheitslücken, die jedoch 
wiederum spezialisiert sind. Godefroid, Peleg und Singh (2017) erforschen beispiels- 
weise ML-Ansätze für Input-Fuzzing. Fuzzing bezeichnet das Finden von Sicherheits- 
lücken in Parsern, die Programm-Input überprüfen. Grammatik-basierte Parser- 
Ansätze werden dort als besonders effektiv eingestuft, um mit komplexem Input 
umzugehen, wie er beispielsweise für Web-Browser besteht. Diese erhalten als Input 
u. a. HTML-Dokumente und JavaScript-Code. Die Parser-Grammatiken werden heute 
noch von Menschen definiert. Der Forschungsansatz untersucht das automatische 
Generieren der Grammatiken auf Basis von ML-Techniken. 


Ein ganz anderer Ansatz wird von Benadjila, Prouff, Strullu, Cagli und Dumas (2018) 
verfolgt. Sie untersuchen Technologien des tiefen Lernen (Deep Learning, DL) zur 
Seitenkanalanalyse und setzen auf Ansätze, die zeigen, dass DL-Algorithmen effizi- 
ent sind, um das Verhalten eingebetteter Systeme und deren Abhängigkeiten unter- 
einander zu evaluieren. Kritisiert wird, dass bei den bestehenden Verfahren die Para- 
metrisierung der neuronalen Netze nicht veröffentlicht wird und entsprechend 
Ergebnisse nicht reproduziert werden können. Als Ergebnis führen sie eine offene 
Plattform ein, ASCAD, die alle Quellen der Implementierung offenlegt. 


Chen, Sultana und Sahita (2018) stellen einen DL-Ansatz vor, um Kontrollflüsse wäh- 
rend der Hardwareprogrammausführung bezüglich Schadcode zu klassifizieren. 


20 ebd. 
21 ebd. 
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ML zur sichereren Kommunikation vernetzter IT-Systeme in Unternehmen 


Eine weitere Herausforderung bei der Absicherung vernetzter IT-Systeme in Unter- 
nehmen besteht darin, dass eine enorm große Menge an Daten beim Monitoring der 
Netzwerke entsteht. Industrieunternehmen arbeiten häufig mit sehr heterogenen 
Teilsystemen und Komponenten, womit eine Vielfalt an Schnittstellen und Netzwerk- 
protokollen einhergeht. Es handelt sich um Systemlandschaften aus EDV, SCADA- 
Systemen (Supervisory Control and Data Acquisition), eingebetteten Systemen und 
Produktionsmaschinen sowie Bussystemen, Internettechnologien, Firewalls und 
Netzwerktechnologie, um nur einen kleinen Ausschnitt zu nennen. Mit der Automa- 
tisierung von Prozessen aller Art steigt der Vernetzungsgrad ständig an. Der Schutz 
durch Firewalls und Antiviren-Programme reicht heute nicht mehr aus, und es wur- 
den deshalb zusätzliche Alarmtechnologien entwickelt, darunter Intrusion Detection 
Systems (IDS) oder Honeypot.s.?? 


Die Erkennung von Einbrüchen (Intrusion Detection) in solche vernetzten System- 
landschaften basiert im Wesentlichen auf der Analyse der Netzwerkkommunikation, 
um Angriffsmuster zu identifizieren.?? Dafür zeichnen Sensoren möglichst umfassend 
Datenpakete auf (Logging). Das anfallende Datenvolumen stellt allerdings eine Her- 
ausforderung für die Auswertung dar, einerseits hinsichtlich der Schnelligkeit, ander- 
seits hinsichtlich der potenziellen Zusammenhänge zwischen den an den verschiede- 
nen Sensoren erfassten Daten. 


Die in den Logdaten identifizierten potenziellen Angriffe erzeugen eine sehr hohe 
Anzahl an Angriffsalarmen. Dies ergibt sich einerseits daraus, dass diverse Alarme 
ausgelöst werden, obwohl es sich gar nicht um einen Angriff handelt (false positive), 
andererseits aber auch aus der puren Menge der meist automatisch generierten 
Angriffe durch Hacker. Ein Sicherheitsanalytiker kann jedoch mit etwa 30 Warnun- 
gen pro Tag nur einen Bruchteil dieser Alarme bearbeiten (Patel 2017). 


KI und ML sind also dringend notwendig, um diese Analysen zu unterstützen oder zu 
automatisieren. Die Nutzung von ML-Verfahren ist jedoch aufwendig, da sie im 
Regelfall umfangreich parametrisiert oder trainiert werden müssen. Der IT-Sicher- 
heitsanbieter Symantec sammelt dafür Bedrohungs- und Angriffsdaten aus 175 Mil- 
lionen Endgeräten und 57 Millionen Angriffssensoren. Nach deren Angaben resultie- 
ren daraus knapp vier Billionen Beziehungen, die ununterbrochen überwacht wer- 


22 https://de.wikipedia.org/wiki/Honeypot, zuletzt geprüft am 22.06.2018 
3 https://de.wikipedia.org/wikilintrusion_Detection_System , zuletzt geprüft am 22.06.2018 
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den.?* Außerdem werden mit Hilfe von ML Modelle erlernt, um Voraussagen über 
Ereignisse und Verwundbarkeiten in der Zukunft zu treffen.” 


Haq et al. (2015) stellen eine umfangreiche Studie zu Verfahren des ML für IDS vor. 
Darin untersuchen sie 49 Forschungsbeiträge zu Klassifikationsalgorithmen für Intru- 
sion Detection, sowohl zum überwachten als auch zum unüberwachten Lernen. 
Beim überwachten Lernen werden meistens die Trainingsdaten vorkategorisiert, ver- 
einfacht in „Angriff“ oder „kein Angriff”. Durch Vergleiche werden neue Fälle ent- 
sprechend einsortiert und die Sortierung wird fortlaufend überwacht. 


Methoden zum unüberwachten Lernen lassen sich im Wesentlichen als Clusterver- 
fahren charakterisieren. In Haq et. al. werden dazu eine ganze Reihe von Verfahren 
genannt, für deren Erläuterung hier auf das Originalpapier verwiesen wird. Beispiele 
für überwachtes Lernen sind Artificial Neural Network, Bayesian Statistics, Gaussian 
Process Regression, Lazy learning, Nearest Neighbor algorithm, Support Vector 
Machine, Hidden Markov Model, Bayesian Networks, Decision Trees (C4.5, ID3, 
CART, Random Forrest), K-nearest neighbor, Boosting, Ensembles classifiers, Linear 
Classifiers und Quadratic classifiers. Beispiele für unüberwachtes Lernen sind dort 
Cluster analysis, Hierarchical clustering, Self-organizing map, Apriori algorithm, Eclat 
algorithm und Outlier detection. 


Besonders schwierig ist die Erkennung von Advanced Persistent Threats (APTs).?° Sie 
sind meistens auf ein ganz bestimmtes Ziel im Unternehmen ausgerichtet, nutzen 
unter Umständen unbekannte Sicherheitslücken und verwenden sehr komplexe 
Angriffsstrategien, die zudem nicht nur auf IT beruhen. Die Angriffe sind beharrlich 
und verlaufen über Wochen, Monate oder Jahre. Durch den speziellen Zuschnitt sind 
sie kaum anhand allgemeiner Muster zu erkennen. Für die Identifizierung sind oft 
detaillierte Analysen notwendig. 


Arnaldo, Cuesta-Infante, Arun, Lam, Bassias und Veeramachaneni (2017) stellen in 
ihrem Forschungsbeitrag einen Rahmen vor, um Repräsentationen von Logdaten zu 
lernen, mit dem Ziel, APTs zu erkennen, die sich über mehrere Wochen hinziehen. 
Der Ansatz nutzt eine divide-and-conquer- Strategie (rekursive Problemzerlegung mit 
anschließender Synthese) und kombiniert diese mit Verhaltensanalysen und Zeitrei- 
henmodellen. Es wird gezeigt, dass auf einer Basis von drei Milliarden Zeilen Log- 


24 https: /\www. websecurity.symantec.com/de/de/security-topics/machine-learning-new-fron- 
tiers-advanced-threat-detection , zuletzt geprüft am 22.06.2018 

2 https:/\www.recordedfuture.com/machine-learning-application/ , zuletzt geprüft am 
22.06.2018 

2 https://searchsecurity.techtarget.com/definition/advanced-persistent-threat-APT, zuletzt 
geprüft am 22.06.2018 
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daten gute Resultate erzielt werden mit 95 von 100 richtig erkannten Beispielen im 
Vergleich zu Testdaten. 


Laurenza et al. (2017) verfolgen hinsichtlich APTs einen anderen Ansatz. Sie gehen 
davon aus, dass vor allem eine Priorisierung in der großen Anzahl von Informationen 
zu potenziellen Angriffen erfolgen muss. Vorgeschlagen wird ein Vorgehen für die 
Sichtung der Alarme mit Fokus auf APTs. Betrachtet werden dafür nur statische 
Schadcode-Eigenschaften, die schnell ausgewertet werden können. Damit wird ein 
Random Forest classifier trainiert. Das Verfahren scheint eine hohe Präzision zu errei- 
chen. Es nutzt Entscheidungsbäume, die „zufällig“ wachsen, sowie nach der Lern- 
phase Klassifizierungen für Entscheidungen. 


ML im Einsatz bei der Kommunikation im Internet 


Private Rechner und Unternehmenssysteme inklusive IT-Komponenten von Produkti- 
onsanlagen sind heute komplex vernetzt. Hinzu kommt eine stetig steigende Anzahl 
netzfähiger Geräte, Sensoren und Gegenstände, die das Internet zu einem Internet 
der Dinge (loT) erweitern. Alle eingebundenen Elemente kommunizieren miteinan- 
der. Über diese Kommunikation können sie kompromittiert bzw. zu einem Verhalten 
veranlasst werden, das von den Eigentümern nicht zugelassen und erwünscht ist. 
Botnetze sind ein prominentes Beispiel, und sie erleben geradezu eine Blüte durch 
die Optionen, die das loT bietet. Das Risiko und der Aufwand zum „Mieten“ von 
Botnetzen ist für Angreifer verhältnismäßig gering - bei gleichzeitig lukrativen Zie- 
len.” Das BSI (BSI 2017, S. 29) geht von 27.000 Bot-Infektionen deutscher Systeme 
täglich aus. 


Ein Botnetz umfasst vernetzte Schadprogramme, die Bots, die ohne Einverständnis 
der Eigentümer auf deren Rechnern installiert wurden. Häufig sind gerade private 
Rechner betroffen?®, was insbesondere den Takedown der Botnetze, also deren flä- 
chendeckende Abschaltung, sehr aufwendig und kaum organisierbar macht. Nach 
Schätzungen sind weltweit rund ein Viertel aller Rechner betroffen.?? Die Infektion 
durch Bots verläuft auf dem gleichen Weg wie bei anderen Schadprogrammen. Häu- 
fig befindet sich der Schadcode in einem E-Mail-Anhang, der durch Anklicken akti- 
viert wird. Ebenfalls weit verbreitet ist die Infektion durch den Besuch von Webseiten. 
Durch die Anwahl von Internet-Links oder sogar schon allein durch den Besuch kom- 


27 https://www.heise.de/ix/meldung/loT-Sicherheitskonferenz-Unsichere-Smart-Meter-Mirai- 
und-seine-Klone-und-die-Genfer-Konvention-3872793.html , zuletzt geprüft am 
22.06.2018 

28 http://www, searchsecurity.de/definition/Botnet , zuletzt geprüft am 22.06.2018 

2 https://wiki.botfrei.de/Botnetze,, zuletzt geprüft am 22.06.2018 
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promittierter Webseiten kommt es zum Download von Schadcode: Drive-by-Down- 
load. Schadcode kann aber beispielsweise auch in Dokumenten eingebettet sein, 
etwa in Office-Dokumenten. Häufig verläuft die Infektion zweistufig. Der erste Schritt 
dient dem Download des Bots oder einer Vorstufe, worüber danach die unerlaubte 
Kontrolle über den privaten Rechner gewonnen wird (BSI 2017, S. 22). „Die betrof- 
fenen Systeme werden vom Botnetz-Betreiber mittels eines Command-and-Control- 
Servers (C&C-Server) kontrolliert und gesteuert.” (BSI 2017, S. 78). 


Es ist üblich, dass kriminelle Betreiber Botnetze aufbauen, diese aber nicht sofort und 
eventuell nicht selbst einsetzen. Sie werden an Dritte vermietet, die sie für konkrete 
Angriffe verwenden. Die Botnetze sind beispielsweise in der Lage, private Rechner 
zum Versenden von Spam-Mails zu nutzen, sodass der wirkliche Versender anonym 
bleibt. Sehr bekannte Angriffe über Botnetze waren sogenannte DDos-Angriffe. 
DDos steht für Distributed Denial of Service. Diese „...Angriffe richten sich gegen die 
Verfügbarkeit von Diensten, Webseiten, einzelnen Systemen oder ganzen Netzen.” 
(BSI 2017, 5.79) Durch den gemeinsamen Angriff einer hohen Anzahl von Bots auf 
bestimmte Server wird z. B. eine Überlastung der betroffenen Systeme provoziert, 
um diese lahmzulegen. 


Durch Botnetze sind bereits sehr bekannte Angriffe erfolgt. Botfrei.de stellt dazu 
umfangreiche Informationen zur Verfügung”: Avalanche, eines der weltweit größten 
Botnetze, wurde schon im Jahr 2008 entdeckt. Mit ihm wurden Massen-Spams ver- 
teilt und Phishing-Attacken umgesetzt. Avalanche unterhielt weitere 20 Botnetze zur 
Verbreitung von Schadprogrammen. Erst Ende 2016 konnten die Strafverfolgungs- 
behörden Avalanche abschalten.?' 


2017 erzielte das Mirai-Botnetz höchstes Aufsehen. Es veranlasste Ausfälle und Stö- 
rungen bekannter Dienste wie Amazon, Netflix, Twitter und Github.?? Der DDoS- 
Angriff nutzte vor allem ungeschützte Geräte im loT, wie Kameras, Heizungssteue- 
rungen und Babyfons.? Mit Bekanntwerden von Mirai wurden Ableger unmittelbar 
für neue Angriffe genutzt.” 


Das Detektieren von Botnetzen ist eine Herausforderung.” ML ist eine Möglichkeit, 
bestehende Detektionsmethoden zu ergänzen. So ist es Wissenschaftlern der Ben- 


3 https://wiki.botfrei.de/Botnetze, zuletzt geprüft am 22.06.2018 

3! https://wiki.botfrei.de/Avalanche , zuletzt geprüft am 22.06.2018 

32 https://wiki.botfrei.de/Mirai , zuletzt geprüft am 22.06.2018 

3 ebd. 

3 httos://www.heise.de/security/meldung/Mirai-Botnetz-Iernt-neue-Tricks-3670226.html,, 
zuletzt geprüft am 22.06.2018 

3 https://www.internet-sicherheit.de/forschung/botnetze/botnetz-analyse.html, zuletzt 
geprüft am 22.06.2018 
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Gurion-Universität zusammen mit den Deutsche Telekom Innovation Laboratories 
2016 gelungen, mit einem ML-Verfahren Angriffe von realen Personen von denen 
durch Botnets auf Honeypots zu unterscheiden. So konnten wertvolle Informationen 
zum Aufspüren der Netze geliefert werden (vgl. Thiede 2016). Stevanovic und Peder- 
sen (2016) stellen einen Überblick über ML-Methoden zum Erkennen von Botnetzen 
vor, die die Botnetz-Netzwerkkommunikation analysieren. Als bisher ungelöste Prob- 
leme werden darin die fehlende Übertragbarkeit bei der Erkennung von Botnetzen 
bemängelt, die Zeit, die für die Analysen notwendig ist, und die Schwierigkeit, die 
Methoden verständlich im operationalen Betrieb einzusetzen. Miller und Busby-Earle 
(2016) analysieren detailliert die Rolle von konkreten ML-Verfahren für die Erken- 
nung von Botnetzen. 


Cyber Threat Intelligence (CTI) ist ein Abwehrkonzept, das den gesamten Prozess 
rund um das Auffinden von Bedrohungen umfasst, deren Auswertung und Aufberei- 
tung sowie Weitergabe. CTI untersucht „Details über die Motivation, die Intention 
und die Fähigkeiten von Angreifern, ihre Taktik, Techniken und Vorgehensweisen” 
sowie „technischere Details, wie typische Spuren von Angriffen (loCs für „Indicators 
of Compromise”), Listen mit Prüfsummen von Malware-Objekten oder Reputations- 
listen für Hostnamen / Domains.” ?® Um Sicherheitslücken schließen zu können, müs- 
sen Software- und Hardware-Anbieter, teilweise auch die Nutzerinnen und Nutzer, 
möglichst flächendeckend über Schwachstellen und Angriffe informiert werden. 
Werkzeuge zur „Threat Intelligence” leisten diese Aufgabe. Sie sammeln und aggre- 
gieren Daten aus unterschiedlichen Quellen und stellen die Ergebnisse in Form von 
„Data Feeds” zur Verfügung. Manche Systeme agieren teilweise automatisiert. Die 
Data Feeds umfassen z. B. Informationen zu IP-Adressen, die eine Bedrohung darstel- 
len, über Phishing-URLs bis hin zu schadhafter Software. Die Nutzung solcher Dienste 
ermöglicht es, Lücken proaktiv zu schließen. Auch für CTI wird ein Potenzial beim 
Einsatz von ML gesehen.?” 


Die Nutzung von ML durch Angreifer 


Es sind bisher keine Beispiele bekannt, dass Angreifer Lernmodelle kompromittiert 
haben, aber es ist zu erwarten, dass sie in Zukunft auch ML nutzen. Es ist deshalb 


36 http://www, secupediia.info/wiki/Cyber_Threat_Intelligence#ixzz5COnLUozU,, zuletzt 
geprüft am 22.06.2018 

37 http://www. wipro.com/documents/Demystifying-machine-learning-for-threat-detection. 
pdf, zuletzt geprüft am 17.07.2018 

38 httos://www.computerwoche.de/a/wie-maschinelles-lernen-zum-verhaengnis- 
wird, 3544253 , zuletzt geprüft am 22.06.2018 
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dringend notwendig, entsprechende Kompetenzen auch bei den Entwicklern von 
Sicherheitssystemen aufzubauen. ML-Verfahren sind angreifbar, indem die trainier- 
ten Klassifizierer, die Modelle, die neuronalen Netze, Bäume etc. mit feindlichen Bei- 
spielen unterlaufen werden. Wird der Lernprozess gestört, so entscheiden die Algo- 
rithmen am Ende u. U. fehlerhaft zugunsten der Angreifer. Durch den Einsatz von 
ML-Methoden erhöhen sich also letztlich die möglichen Angriffsvektoren. Allerdings 
wären solche Angriffe hochkomplex - und es ist unklar, wie hoch das Risiko dafür 
tatsächlich ist. Hayes und Danezis (2018) diskutieren das Problem, dass Klassifizierer 
durch feindliches Einschleusen von Falschbeispielen zu schlechten oder falschen Ent- 
scheidungen provoziert werden können. Sie stellen das Szenario eines feindlichen 
Netzwerkes vor, das täuschenden Output für Klassifizierer erzeugt. Auch Kos, Fischer 
und Song (2017) untersuchen Methoden, wie feindliche Lernbeispiele die Generie- 
rung von Modellen beeinflussen. Normalerweise sollten Angreifer keinen Zugang zu 
den Strukturen und Parametern der ML-Modelle der Sicherheitssysteme besitzen, 
denn das Zielsystem ist eine Blackbox. Hu und Tan (2017) stellen allerdings einen 
Algorithmus vor, der diese Blackbox-Modelle umgehen kann. Die Erkennungsrate 
wird deutlich verringert. 


ML gegen Angriffe über verschlüsselte Kommunikation 


Verschlüsselung dient dem Schutz von Daten, die während einer Netzkommunika- 
tion übertragen werden. Sehr bekannt ist beispielsweise das SSL-Protokoll. Es wird 
sichtbar, wenn im Web-Browser einer URL „https” vorangestellt ist. Leider können 
auch Angreifer verschlüsselte Kommunikation ausnutzen. Sie können mit verschlüs- 
selten Daten verhindern, dass Angriffserkennungssysteme Signaturen (s. o.) sinnvoll 
einsetzen können. Es besteht dann noch die Option, die Angriffe mit Hilfe der Kom- 
munikationsmetadaten zu entlarven. Für solche Anomalieerkennung eignen sich ML 
oder auch Methoden der KI.3? 


Im CISCO Security-Report von Februar 2018, wird festgestellt, dass immer mehr 
Web-Kommunikation verschlüsselt ist und sich innerhalb von 12 Monaten verdrei- 
facht hat.“ Er geht von einem Anteil von rund 50 Prozent verschlüsselter Kommuni- 
kation aus. Nach Angaben von CISCO nutzen heute bereit 34 Prozent der Unterneh- 


39 httos://www. searchsecurity.de/antwort/Wie-lassen-sich-verborgene-SSL-Angriffe-erken- 
nen-und-abwehren, zuletzt geprüft am 22.06.2018 

@ _http://www.netzwerker.news/content/Malware-versteckt-sich-in-verschluesseltem-Traffic. 
htmI?_pr=1, zuletzt geprüft am 22.06.2018 
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men ML- und 32 Prozent KI-Systeme, die auch Angriffe mit verschlüsselten Anteilen 
erkennen können. Das wird zunehmend relevant in Cloud- und IoT-Umgebungen.* 


ML für datenschutzkonforme IT-Sicherheit 


Datenschutz und IT-Sicherheit stehen in einem höchst spannungsgeladenen Zusam- 
menhang. Die Diskussionen dazu sind zu umfangreich, um hier angemessen wieder- 
gegeben zu werden. Verkürzt steht die Behauptung im Raum, es wäre sehr viel ein- 
facher, Angriffe zu erkennen, wenn Kommunikation bis ins Detail überprüft und 
festgehalten würde und keine Verschlüsselung stattfände. Dies widerspricht jedoch 
unseren demokratischen Grundwerten mit den über Jahrzehnten entwickelten juris- 
tischen Rahmenbedingungen und darf deshalb so nicht umgesetzt werden (vgl. z. B. 
Friedrich-Ebert-Stiftung 2007). 


Eine besondere Herausforderung stellt das für die Erkennung von APTSs dar (s. o.). Oft 
müssen dafür auch Verhaltensweisen von Personen eingeschätzt werden. Das gelingt 
nur, wenn Daten personenbezogen gespeichert werden. Solche Ansätze werden als 
User Behavior Analytics (UBA) bezeichnet und nutzen auch ML. Es ist eine Herausfor- 
derung, diese datenschutzkonform zu gestalten. Neben den Datenschutzproblemen 
gibt es für UBA auch schwerwiegende technische Probleme. Wie erkennt man etwa 
normales Verhalten von Personen? Auf Basis welcher Beispiele wird gelernt und 
worin bestehen die relevanten Eigenschaften komplexer Situationen? Außerdem 
fehlt für manche ML-Verfahren die notwendige Menge an Trainingsdaten (Strobel 
2017). 


ML in der Praxis 


In der Praxis werden Methoden des ML heute schon eingesetzt und es existieren 
diverse Anbieter, die damit werben. Tabelle 4.1 stellt das Ergebnis einer Internetre- 
cherche dazu dar. Die Liste erhebt keinen Anspruch auf Vollständigkeit, sondern bie- 
tet nur einen Einblick. Anhand der Informationen, die von den Anbietern öffentlich 
zur Verfügung gestellt werden, ist nicht im Detail abzulesen, wie fortgeschritten die 
Nutzung der ML-Methoden ist. Im Rahmen der Recherche wurden die Orte der 
Hauptsitze der Unternehmen festgehalten und aufgenommen, ob Niederlassungen 
in Deutschland existieren. Es zeigt sich, dass viele der Unternehmen einen Sitz in 
Deutschland haben, sodass davon ausgegangen werden kann, dass auch in Deutsch- 
land Forscher und Praktiker Kompetenzen zur ML und IT-Sicherheitspraxis besitzen. 


@  httos://Igblogs.cisco.com/de/cisco-security-report-gefahrenabwehr-mit-kuenstlicher-intelli- 
genz-machine-learning-und-automation/, zuletzt geprüft am 22.06.2018 
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Ein großer regionaler Schwerpunkt der Unternehmen ist das Silicon Valley in den 
USA. 


Tabelle 4.1: Unternehmen, die ML- Methoden in ihren IT-Sicherheitsprodukten einsetzen 


ANBIETER ML-NUTZUNG FIRMENSITZ 
Atos Atos nutzt Automatisierung und maschinelles Lernen um An- Atos Bezons, Frankreich 
griffe zu verstehen und vorherzusagen.' (vgl. auch Atos 2017) Atos IT Solutions and 
Services: 


München, Deutschland 


G DATA G DATA stellen in ihrem Blog ausführlich dar, welche Bochum, Deutschland 
ML-Ansätze sie gegen Phishing-Angriffe nutzen.? 

Bitdefender Sandbox-Analyzer nutzt maschinelles Lernen zur Verhaltens- Bukarest, Rumänien 
analyse. „Vorausschauende Erkennung unbekannter Malware. Tettnang, Deutschland 


Dynamische Dateianalyse trainiert anhand von Milliarden von 
Beispielen. Bedrohungsdatenbank auf der Basis von über 500 
Millionen Endpunkten."? 


Centrify Centrify ist ein Lösungsanbieter zum Schutz digitaler Santa Clara, USA 
Identitäten. „Der neue Service nutzt maschinelles Lernen zur 
Risikoeinschätzung, basierend auf dem sich ständig verändern- 
den Anwenderverhalten. Anhand dieser Risikoeinschätzungen 
werden Anwenderaktivitäten Risc Scores zugeteilt und die 
passenden Reaktionen auf diese Aktivitäten durchgeführt. Da- 
bei entscheidet der Service in Echtzeit, ob der Zugriff gewährt 
wird, ob zu einer besseren Authentifizierung aufgefordert 
werden soll oder ob der Zugriff komplett geblockt wird. “+5 


CheckPoint CheckPoint nutzt maschinelles Lernen zur Identifikation von Tel Aviv, Israel 
Angriffen.° Es werden „Muster von aktuellen Bedrohungsda- San Carlos, USA 
ten” eingebunden, die beim Kunden anfallen.” 


Cylance Nutzt Künstliche Intelligenz für Endpunkt-Sicherheit. u.a.: Irvine, USA 
Schadcode Prävention, Applikations- und Skript-Kontrolle, Cylance Germany: 
Angriffsverfolgung, Ursachenanalyse‘°, weiterhin Erkennung von München, Deutschland 
Schadcode ohne Signaturen mit Hilfe von ML (Strobel, 2017) 


https:/latos.net/en-gb/united-kingdom/digital-vision-programmeldigital-vision-cyber-security, zuletzt geprüft am 13.06.2018 
https: //wwvw.gdata.de/blog/2018/05/smarterphishing-schutz, zuletzt geprüft am 15.06.2018 
https:/Iwumn.bitdefender.de/business/elite-security.html, zuletzt geprüft am 13.06.2018 


https: /Iwum. it-cloud.today/centrify-analytics-service-stoppt-in-echtzeit-sicherheitsverletzungen-basierend-auf-dem- 
anwenderverhalten/#more-21199, zuletzt geprüft am 14.06.2018 


5 https://www.silicon.de/41661245/ki-und-maschinelles-lernen-in-der-it-security/?inf_by=5a1d32c5671db8a0218b4b82, 
zuletzt geprüft am 14.06.2018 


https:/Iwumn.checkpoint.com/press/20 18/check-point-announces-infinity-total-protection-unique-new-security-model- 
prevent-gen-v-threats-attacks/, zuletzt geprüft am 14.06.2018 


https: //wvww, silicon.de/41661245/ki-und-maschinelles-lernen-in-der-it-security/, zuletzt geprüft am 14.06.2018 
https: /Iwumn. cylance.com/content/damicylance/pdfs/data_sheets/CylancePROTECT.pdf, zuletzt geprüft am 13.06.2018 
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ANBIETER ML-NUTZUNG FIRMENSITZ 
Darktrace „Erkennung und Klassifizierung von Bedrohungen auf Basis Cambridge, Großbri- 
von Anomalieerkennung mittels Machine Learning”?. Eingesetzt tannien 
wird unbeaufsichtigtes maschinelles Lernen ohne Trainings- 
daten. Selbstverteidigung durch Verlangsamen von Angriffen, 
Unterbrechung der Echtzeit, Stoppen der Angriffe.' 
Eserypt Das Unternehmen fokussiert mit seinen Lösungen auf konkrete Bochum, Deutschland 
(100%iges Branchen: Automotive, Smart City, Internet der Dinge. Daten 
Tochterunter- aus der Intrusion Detection werden „mithilfe leistungsstar- 


nehmen der ETAS 
GmbH) 


Eset 
Deutschland 


Exabeam 


Finally Safe 
(Beteiligung duch 
secunet Security 
Networks) 


G+D 


McAffee / 
McAffee Laps 
(McAffee 
Forschung) 


ker Algorithmen für maschinelles Lernen” ausgewertet und 
„Angriffsmuster für die gesamte Flotte” visualisiert. Neue 
Angriffsarten werden identifiziert." 


Sortierung und Klassifizierung von großen Mengen an 
Malware-Samples. Platzieren der analysierten Malware- 
Samples auf einer „Cyber Security Map”, um Relevanz der 
Malware einzuschätzen. „Neuronale Netzwerke für spezielles 
tiefgehendes Lernen und ein langes Kurzzeitgedächtnis. 
Konsolidierter Output von sechs genau gewählten 
Klassifikationsalgorithmen"'?. 


ML für „User Behavior Analytics" Lösung, Aufzeigen 
unauthorisierter Systemzugriffe'? 


Anomalie-Erkennung basiert auf über vier Millionen möglicher 
Paketinformationen. Mit Verfahren des maschinellen Lernens 
wird ein Modell der Netzwerk-Kommunikation erstellt, also das 
Netzwerkverhalten erlernt, um dann Anomalien aufzudecken.'* 


Giesecke + Devrient setzen ML zur Aufdeckung von unge- 
wöhnlichen Systemreaktionen ein. Bestandteil der Lösung ist 
ein lernendes Anomalieerkennungssystem (Anomaly Detection 
System, ADS). 


„McAfee nutzt maschinelles Lernen und andere unbeaufsichtig- 
te Lernalgorithmen in seinem gesamten Portfolio, von Advan- 
ced Threat Defense (ATD) und Security Information and Event 
Management (SIEM) bis hin zu URL Classification Systems und 
im Gateway.” (Patel, 2017) 


Bratislava, Slowakei 
Eset Deutschland: 
Jena, Deutschland 


San Mateo, USA 


Essen, Deutschland 


München, Deutschland 


Santa Clara, USA 
McAffee Labs: 
Hamburg, Deutschland 


https:/Iwvmm. pallas.com/nachrichten/nachrichten-details/news/pallas-ist-zertifizierter-partner-von-darktrace/, zuletzt geprüft am 


13.06.2018 


https://www. wallstreet-online.de/nachricht/8387235-darktrace-cyber-immunsystem-schlaegt, zuletzt geprüft am 13.06.2018 


https: /Iwum.escrypt.com/de/news-events/angriff-erkannt-gefahr-gebannt, zuletzt geprüft am 14.06.2018 


https://www. welivesecurity.com/deutsch/2017/06/22/machine-learning-eset-augur-engine/, zuletzt geprüft am 13.06.2018 


https:/Iwww.exabeam.com/data-science/machine-learning-sdk-for-security-analytics/, zuletzt geprüft am 13.06.2018 


https://www. finally-safe.com/produkt/, zuletzt geprüft am 13.06.2018 


https: //wwvw.gi-de.com/de/de/mobile-security/trends/umgang-mit-cyberrisiken/, zuletzt geprüft am 15.06.2018 
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One Identity One Identity, heute Teil von Quest Software, erwarb Anfang Aliso Viejo, California 


2018 das Unternehmen Balabit. Die dort entwickelte Techno- 
logie realisiert Privileged-Account-Analytics (PAA), die Analyse 
privilegierter Nutzerinnen und Nutzer, um insbesondere Insider- 
Attacken zu erkennen. Dafür werden Verfahren des 
maschinellen Lernens und der künstlichen Intelligenz einge- 


setzt.'617 
Palo Alto Bietet Plattform für hoch automatisierte Systemanalysen. Santa Clara, USA 
Networks Das Unternehmen übernahm 2017 die LightCyber, einen 


Technologieexperten zur Analyse von Systemverhalten.'® 
Gelernt wird „normales” Kommunikationsverhalten (Strobel, 2017). 


Recorded Future Recorded Future hat eine eingetragene Marke Threat Intel- Somerville, USA 
ligence MachineTM. Genutzt werden ML und Verfahren zum 
Verstehen natürlicher Sprache. '° 


Rhode & Schwarz Auf Grundlage recherchierten Informationen wird angenom- München, Deutschland 


men, dass Rhode & Schwarz „Deep Learning" -Ansätze nutzt 
oder vorbereitet. Rhode & Schwarz entwickelt auf Basis einer 
CUDA-Architektur „Deep Learning” -Unterstützung?. CUDA 
wurde von NVIDIA entwickelt und nutzt Grafikprozessoren 
(GPU), um Lernverfahren in „Deep Learning”-Netzen durch 
starke Parallelisierung von Rechenprozessen zu beschleunigen. 


Securonix ML (sowohl überwachte als auch unüberwachte Verfahren), Addison, USA 
Angriffsmodellierung und statistisch Ansätze für die Analyse 
von Systemverhalten zur Umsetzung Signturloser Technologien.” 


Sonic Wall Sonic Wall führt in Echtzeit tiefgreifende Speicheranalysen mit San Jose, USA 
ML-Ansätzen mit einer dafür entwickelten Technologie durch, 
die in einer Cloud Plattform integriert sind.?? Sonic Wall liefert 
performante Lösungen, „um den verschlüsselten Datenverkehr 
zu entschlüsseln, zu untersuchen und wieder zu verschlüsseln” 
und „dabei unterschiedlichste Schadsoftware zu erkennen”, 


https: /Iwvumsilicon.de/41661245/ki-und-maschinelles-lernen-in-der-it-security/, zuletzt geprüft am 13.06.2018 


https: /Iwww. quest.com/community/products/one-identity/news/b/press-releases/posts/one-identity-acquires-balabit-to- 
bolster-privileged-access-management-solutions#, zuletzt geprüft am 13.06.2018 


https://www. paloaltonetworks.com/company/press/2017/palo-alto-networks-completes-acquisition-of-lightcyber, 
zuletzt geprüft am 13.06.2018 


https:/I\wvmn.recordedfuture.com/technology/, zuletzt geprüft am 14.06.2018 

https: //wvvww.careers.rohde-schwarz.com/de/spezialseiten/karriere-news/?nid=41, zuletzt geprüft am 13.06.2018 

https: //wwvw. securonix.com/leverage-machine-learning-cybersecurity/, zuletzt geprüft am 13.06.2018 

https: /Iwum. sonicwall.com/en-us/about-sonicwall/news/press-releases/pr-articles/sonicwall-invents-real-time-deep-memory- 
inspection zuletzt geprüft am 15.06.2018 

https: //wvww. silicon.de/41661245/ki-und-maschinelles-lernen-in-der-it-security/?inf_by=5a1d32c5671db8a0218b4b82, 
zuletzt geprüft am 15.06.2018 
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Sophos Endpunkt-Schutz. Übernahme von Invincea in 2017 mit Kom- Abingdon, Großbritan- 
petenz zum Ausschalten bislang unbekannter Schadsoftware nien 


und hochentwickelter Cyberattacken mit Hilfe patentierter 
neuronaler Netz-Algorithmen (Deep Learning)”; dadurch steht 
Hilfsmittel gegen Zero-Day-Attacken zur Verfügung”. 


Symantec Symantec entwickelt in großem Maße ML-Verfahren. „Dazu Mountain View, USA 
gehören innovative Forschung zu Deep Learning, probabilisti- München, Deutschland 
sche Programmierung, verstärkendes Lernen ("Reinforcement 
Learning") und bayessche nichtparametrische Verfahren.” 


Trend Micro Maschinelles Lernen wird seit über 10 Jahren eingesetzt „von Tokyo, Japan 
Deutschland Antispam-Engines bis zu Erkennungstechniken für bösartige Trend Micro 
Social-Media-Elemente."?? Deutschland: 


Hallbergmoos, 
Deutschland 


Vectra Aufdeckung von Angriffen in Echtzeit. Verhaltensanalyse und San Jose, USA 

Networks permanentes maschinelles Lernen. Nutzung unterschiedlicher Vectra Networks 
Verfahren wie überwachtes und unüberwachtes Lernen sowie Germany: 
„Deep-Learning"-Techniken.?® München, Deutschland 


https: wm security-insider.de/sophos-investiert-in-maschinelles-lernen-a-583300/, zuletzt geprüft am 13.06.2018 
https: /Iwvm,silicon.de/41661245/ki-und-maschinelles-lernen-in-der-it-security/, zuletzt geprüft am 13.06.2018 


https://www. websecurity.symantec.com/de/de/security-topics/machine-learning-new-frontiers-advanced-threat-detection, 
zuletzt geprüft am 13.06.2018 


https: //wvw, silicon.de/41661245/ki-und-maschinelles-lernen-in-der-it-security/, zuletzt geprüft am 14.06.2018 


https:/Ivectra.aildach-press/neun-fragen-zu-k-nstlicher-intelligenz-und-cybersicherheit, zuletzt geprüft am 13.06.2018 


Fazit und Ausblick 


Zum Einsatz von ML in der Praxis ist festzuhalten, dass ML bereits von diversen Unter- 
nehmen eingesetzt wird, die Werkzeuge zur Verbesserung der IT-Sicherheit anbieten. 
Anhand der öffentlichen Darstellung ist allerdings nicht immer deutlich, in welchem 
Umfang und welcher Qualität ML-Verfahren genutzt werden. Das wirtschaftliche 
Potenzial wurde aber erkannt. Forschung zur ML im Rahmen von IT-Sicherheit exis- 
tiert aktuell hingegen nur in vergleichsweise geringem Umfang. Die Anzahl von wis- 
senschaftlichen Foren, die die Thematik explizit in den Vordergrund stellen, ist klein. 


Dass eine so komplexe Thematik durch die Wirtschaft vorangetrieben wird, ist über- 
raschend. Der Hintergrund kann in der schlechten Verfügbarkeit realistischer Daten 
für die Forschung sowie im starken Wettbewerb zwischen den Unternehmen liegen. 
Heute sind jedoch noch viele Fragen zum Einsatz von ML-Verfahren im Rahmen von 
IT-Sicherheit ungelöst. Es ergibt sich die Hypothese, dass eine bessere Kooperation 
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von Forschung und Wirtschaft die Potenziale der ML effektiver ausloten würde. Die 
Recherchen zu diesem Artikel legen nahe, dass eine Analyse zu den Barrieren, die in 
Bezug auf diese Kooperation bestehen, nützlich wäre. 


Wichtige Forschungs- und Entwicklungsfragen, die es zu lösen gilt sind u. a.: 


Die Ergebnisqualität der ML-Methoden hängt maßgeblich vom Training und der 
Qualität der Trainingsdaten ab. Leider sind reale Kommunikationsdaten für For- 
scherinnen und Forscher meist schlecht oder gar nicht zugänglich. Wie im Artikel 
geschildert, bilden aber meist erst Millionen von Datensätzen die Grundlage für 
ein qualitativ hochwertiges Training der ML-Methoden. Unternehmen sind häufig 
nicht gewillt, ihre Daten zur Verfügung zu stellen. Hier müssen Lösungen gefun- 
den werden. 


Der Aufwand zum Training der ML-Methoden ist sehr hoch. Es werden jeweils 
umfangreiche Trainingsdaten benötigt, die mit hohem Auffand aufbereitet wer- 
den müssen. Das Verhältnis von Aufwand und Nutzen beim Einsatz von ML muss 
klarer werden bzw. durch Kooperation verringert werden. 


Die Einsatzfelder konkreter ML-Verfahren sind im Allgemeinen sehr spezialisiert. 
Ob es möglich ist, der Hoffnung auf umfangreich selbstlernende Systeme nach- 
zukommen, kann in naher Zukunft vermutlich noch nicht beantwortet werden. Es 
stellen sich Fragen nach der Fokussierung versus Generalisierung sowie der Wie- 
derverwendbarkeit. 


Der Einsatz vom ML erhöht die Anzahl der Angriffsvektoren. In vielen ML-Verfah- 
ren kann außerdem nicht expliziert werden, „was” gelernt wurde. Ein nicht uner- 
heblicher Teil der Forschung beschäftigt sich deshalb genau mit der Frage, wie 
ML-Modelle kompromittiert werden können, aber noch nicht mit dem Schutz der 
Modelle. 


ML wird auch für das Erlernen von Verhaltensmustern von potenziellen Angrei- 
fern genutzt. Die Einhaltung des Datenschutzes ist dabei eine wichtige und 
schwierige Herausforderung. 


ML-Verfahren haben bei ihren Entscheidungen im Einsatz im Allgemeinen Grau- 
zonen. Wie gut die Ergebnisqualität der Methoden ist oder werden kann, ist in 
vielen Fällen Forschungsgegenstand. 
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Einleitung: Kl ohne Grenzen? 
Peter Gabriel 


Der Phantasie, Anwendungen der Kl zu ersinnen, sind keine Grenzen gesetzt: 
Maschinen und Software werden zu „intelligenten“ Artefakten, die mühelos 
auch schwierigste Situationen meistern. Das reicht vom Chatbot, der in medi- 
zinischen Fragen eigenständig berät, bis hin zum autonomen Auto, das seine 
Fahrgäste sicher von A nach B bringt - auch im dichtesten Stadtverkehr. Aber 
in welchen Wirtschaftszweigen und in welchen Anwendungsfeldern wird KI 
tatsächlich in den kommenden Jahren ihr Potenzial, auch anspruchsvolle 
menschliche Tätigkeiten zu automatisieren, entfalten können? Zwar gibt es 
spektakuläre Einzelbeispiele, wie das Schachprogramm, das den Weltmeister 
schlägt, oder den Sprachassistenten im Smartphone. Darüber hinaus ist diese 
Frage aber nicht leicht zu beantworten, denn die meisten bekannten KI- 
Anwendungen stecken in der Praxis noch in den Kinderschuhen. 


Carl Benedikt Frey and Michael A. Osborne von der Universität Oxford hatten sich in 
ihrer viel zitierten und oft kritisierten Studie aus dem Jahr 2013 zur Auswirkung der 
„Computerisation“ auf Jobs in den USA noch auf die allgemeine Analyse von Arbeits- 
platzprofilen gestützt. Den Einsatz von KI und Kl-gestützter Robotik erwarteten sie 
vor allem im Transportgewerbe und der Logistik, im produzierenden Gewerbe und im 
Dienstleistungssektor (Frey und Osborne 2013). 


Mittlerweile gibt es aber auch erste empirische Studien, in denen sich Unternehmen 
sowohl zum Status quo von Kl-Anwendungen als auch zu den Zukunftserwartungen 
an diese Technologie äußern. 


Um solche Studien einzuschätzen, ist es lohnend, einen genauen Blick in die Betriebe 
selbst zu werfen und deren interne Abläufe - Beschaffung, Forschung und Entwick- 
lung, IT, Personal, Finanzen, Logistik, Produktion/Betriebsführung, Marketing/Ver- 
trieb, Kundendienst - zu betrachten. Das Beratungshaus Sopra Steria ist 2017 in 
einer Unternehmensbefragung so vorgegangen. Danach setzen die interviewten 
Unternehmen heute KI noch vor allem im IT-Betrieb sowie in der Produktion bzw. in 
ihren Standardprozessen ein. Hauptanwendung ist demnach die Automatisierung 
von einfachen, Software-basierten Routineprozessen, etwa der Eingabe einer Rech- 
nung in eine Finanzbuchhaltung. Zunehmend automatisieren sie jedoch auch 
anspruchsvollere („intelligente“) Aufgaben der eigenen Produktion bzw. Dienstleis- 
tung. Das kann etwa eine automatische Erkennung fehlerhaft produzierter Bauteile 
mittels Bildanalyse sein oder die eigenständige Klassifikation von E-Mails in einem 
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Callcenter, um etwa die Beschwerde zu einem Produkt von dem Wunsch nach Ände- 
rung der Lieferadresse zu unterscheiden. 


Die Automatisierung von sehr einfachen Arbeitsprozessen bleibt laut Sopra Steria 
auch in Zukunft wichtig, allerdings wachsen die Ansprüche. An die erste Stelle der 
Zielvorstellungen rückt in den befragten Unternehmen die intelligente Automatisie- 
rung komplexerer Prozesse. Dem folgt der Wunsch nach digitalen Assistenten, die 
Mitarbeiter nicht ersetzen, aber sie in ihrer Tätigkeit unterstützen, etwa in Form eines 
sprachgesteuerten Hilfesystems für den Monteur in der Produktion. Zu diesem wach- 
senden Anspruch an die Leistungsfähigkeit der KI passt, dass in Zukunft Kl-Technolo- 
gien zunehmend auch den für den Unternehmenserfolg zentral wichtigen Kunden- 
dienst unterstützen sollen. 


Für die meisten innerbetrieblichen Anwendungsbereiche läuft der Zweck des KI-Ein- 
satzes vor allem auf eine Kostenreduktion hinaus. Aber nicht immer. Besonders in 
Marketing und Vertrieb sowie im Kundendienst erwarten die befragten Unterneh- 
men, dass die Verwendung von Kl-Innovationen in anderen Bereichen anstoßen 
kann. So will man mit gezielten Datenanalysen die Kunden und ihre Bedürfnisse 
besser verstehen und das eigene Angebot zielgerichtet darauf zuschneiden. Auch bei 
der Beschaffung gehen die befragten Unternehmen davon aus, dass sie mit KI- 
basierten Datenauswertungen die Qualität von Prozess und Ergebnis verbessern kön- 
nen (Sopra Steria 2017). 


Da sich Kl-Applikationen in den Unternehmen noch in einem sehr frühen Stadium 
befinden, wäre es noch zu voreilig, verlässliche Aussagen zum künftigen Einsatz die- 
ser Technologie zu machen. Folgt man einer weltweiten Unternehmensbefragung 
des IT-Dienstleisters Infosys, liegen der Handel, die Konsumgüterindustrie, Telekom- 
munikationsdienstleister und die Finanzwirtschaft an der Spitze der Kl-Anwendungs- 
branchen. Die Tourismusindustrie und die öffentliche Verwaltung blieben demnach 
noch zurück (Infosys 2018). 


Zu einem ähnlichen Ergebnis kommt auch eine volkswirtschaftliche Modellrechnung 
der Unternehmensberatung Accenture, die sich analog zu Frey und Osborne stark 
auf den potenziellen Automatisierungsgrad menschlicher Arbeit stützt. Danach kön- 
nen vor allem die Telekommunikationsdienstleister, das produzierende Gewerbe und 
die Finanzwirtschaft mit einer größeren Steigerung ihrer Bruttowertschöpfung durch 
Kl rechnen. Auch nach dieser Modellrechnung ist die öffentliche Verwaltung das 
Schlusslicht (Purdy und Daugherty 2017). 


Zu einer etwas anderen Einschätzung gelangt das kleine, erst 2014 gegründete 
Marktforschungsunternehmen Tractica: Demnach finden sich heute die wichtigsten 
Kl-Anwendungen bei den Internet- bzw. mobilen Diensten, seien es Sprachsteue- 
rung oder die Kultivierung von Musik, Nachrichten und anderen digitalen Inhalten. 
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Große Nachfrage sieht Tractica derzeit bei Rüstungsunternehmen, die automatisierte 
Waffen- und Logistiksysteme herstellen. Ein eher langfristig nutzbares Anwendungs- 
feld sehen die Meinungsforscher in der Dienstleistungsindustrie wie in der Finanz- 
wirtschaft, der Medienindustrie, den unternehmensnahen Dienstleistungen und in 
der Gesundheitswirtschaft. Das besondere Potenzial der KI verorten sie vor allem bei 
der Verarbeitung von Sprach- und Bilddaten, wenn es darum geht, menschliche 
Tätigkeiten zu ersetzen oder zu unterstützen (Tractica 2016). 


Bei aller Unsicherheit: In den folgenden Beiträgen werden die heute erkennbaren 
Ansätze der Kl-Anwendung skizziert und gewinnen an Kontur: das autonome Auto, 
die Sprachübersetzung, die Robotik. Diese drei sind zurzeit wohl auch die Synonyme 
für Kl in der öffentlichen Wahrnehmung, da die Technologie uns Menschen hier 
frappierend autark zur Seite tritt. Vom Gesundheitswesen erwarten viele Experten, 
dass es allein mit den Kl-Verfahren des Maschinenlernens und der Bildanalyse noch 
gelingen kann, die immensen Datenmengen der digitalen Medizin effizient und sinn- 
voll auswerten zu können. 


Bildung und öffentliche Verwaltung stehen noch nicht im Mittelpunkt der KI-Diskus- 
sion - zu Unrecht. Denn Digitale Bildung ist weit mehr als die Nutzung von Informa- 
tions- und Kommunikationstechnik für die Vermittlung von Wissen. Lernen ist inter- 
aktiv und schließt ein ständiges Feedback mit ein. Die Erschließung der Nutzungsda- 
ten digitaler Lernsysteme wäre hierbei äußerst hilfreich. Kl-basierte Datenanalysen, 
die „Learning Analytics”, können zu einem zentralen Element des Bildungssystems 
werden. Und ein womöglich noch größeres Potenzial zu unserer Unterstützung lässt 
sich mit Kl-Systemen in der öffentlichen Verwaltung erschließen. In großer Zahl anfal- 
lende Standardvorgänge wie einfache Auskünfte und Leistungsberechnungen in der 
Sozialverwaltung lassen sich gut automatisieren — ohne dass die Qualität solcher 
staatlichen Dienstleistungen aus Sicht der Bürgerinnen und Bürger leiden müsste. 
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5. Neue Möglichkeiten für die Servicerobotik durch KI 


Steffen Wischmann, Marieke Rohde 


Serviceroboter gewinnen an Boden, in professionellen Anwendungen ebenso 
wie im privaten Bereich. Diesen Vormarsch verdanken sie in erster Linie Fort- 
schritten in der KI, insbesondere den Verfahren des maschinellen Lernens, der 
Computer Vision und Optimierung, die eine autonomere und adaptivere 
Handlungssteuerung dieser Roboter auch in einem veränderlichen Umfeld 
erlauben. So wird ihr Einsatz auch in Bereichen möglich, die klassischen Indus- 
trierobotern verschlossen bleiben. 


Der Begriff Servicerobotik erklärt sich in Abgrenzung zur klassischen Industrierobotik 
nicht selbst. Die Unterscheidung zwischen beiden ist vielmehr historisch gewachsen. Die 
meisten Roboter, die heutzutage auf dem Markt verfügbar sind, zählen zu den klassi- 
schen Industrierobotern (International Federation of Robotics 2017a), wie sie etwa in 
der Automobilindustrie flächendeckend das Schweißen oder Lackieren erledigen. Indus- 
trieroboter erfüllen normalerweise eine eng begrenzte Aufgabe im Produktionsprozess: 
Ihr Handlungsrepertoire umfasst meistens nur einen einzigen Prozess, der unter eng 
definierten Umgebungsbedingungen auszuführen ist. Aus diesem Grund brauchen sie 
auch nur wenige Sensoren, um sich in ihrem Einsatzbereich zurechtzufinden. Program- 
mierung und Integration dieser Industrieroboter sind allerdings aufwendig und nehmen 
bislang üblicherweise zwischen 60 und 80 Prozent der gesamten Investitionskosten in 
Anspruch, da auch kleinste Änderungen der Anwendung oder der Umgebungsbedin- 
gungen eine Anpassung der Programmierung erforderlich machen. 


Der ISO-Standard 8373 (ISO 2012) listet unter Servicerobotern all jene Robotersys- 
teme, die nicht im vollautomatisierten Umfeld eingesetzt werden. Durch diese Nega- 
tivdefinition gelten sowohl Roboter im privat-individuellen als auch solche im profes- 
sionell-beruflichen Kontext - nur eben außerhalb vollautomatischer Fertigungsstra- 
Ben - als Serviceroboter”?. 


# Die ISO 8373 unterscheidet in Studien wie der World Robotics (International Federation 
of Robotics 2017b) dann in einer weiteren Unterteilung zwischen „Personal Service 
Robots” und „Professional Service Robots”: „Personal Service Robots” werden zu nicht- 
kommerziellen Zwecken genutzt und ihre Bedienung erfordert keine besonderen Kennt- 
nisse. Oftmals ist sogar eine Bedienung durch Laien möglich. „Professional Service 
Robots” werden zu kommerziellen Zwecken genutzt und ihre Bedienung erfordert in der 
Regel entsprechend geschultes Personal. 


V. Wittpahl (Hrsg.), Künstliche Intelligenz, 
DOI 10.1007/978-3-662-58042-4_7, © Der/die Autor(en) 2019 
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Anders als fest in einem Produktionsprozess installierte Industrieroboter müssen Ser- 
viceroboter in einer sich ständig ändernden Umgebung agieren können. Sie müssen 
deshalb dazu in der Lage sein, zu lernen, sich anzupassen und Fehler autonom zu 
korrigieren. Serviceroboter haben daher in der Regel auch deutlich mehr Sensoren als 
Industrieroboter. Da die Genauigkeit und Zuverlässigkeit von Sensordaten häufig 
stark variieren, besteht für die Kontrollsysteme eines Serviceroboters die schwierige 
Herausforderung, ein zutreffendes Bild der Umgebung zu generieren, damit Aktions- 
planung und -steuerung flexibel auf alle Änderungen reagieren können. 


In vielen Bereichen - insbesondere in der Logistik, Medizin, Pflege, Landwirtschaft, 
Inspektion und Wartung - ist ein Trend zum professionellen Einsatz von Servicerobo- 
tern erkennbar. Die entsprechende Hardware steht bereits zur Verfügung. Jedoch 
sind existierende Lösungen oft immer noch in ihrer Funktionalität stark eingeschränkt. 
Eine Anpassung des Verhaltens an neue Bedingungen ist heute noch, ähnlich wie bei 
der klassischen Industrierobotik, mit hohen Systemintegrationskosten verbunden. 


In der Servicerobotik gilt die Programmierung von adaptiven Kontrollsystemen daher 
zurzeit als größte Herausforderung. Dabei setzen die Entwickler zur Flexibilisierung 
der Kontrollsoftware auf KI. Es lassen sich sieben Kl-Technologiebereiche identifizie- 
ren, in denen in den letzten Jahren entscheidende Entwicklungen stattfanden: Com- 
puter Vision, ML, Aktionsplanung und Optimierung, Cognitive Modeling, Semanti- 
sche Technologien, Natural Language Processing (NLP) und Neuromorphic Compu- 
ting (Seifertetal. 2018, s. auch Einleitung zu Kapitel A Technologie „Entwicklungswege 
zur KI”). Insbesondere datengetriebene Verfahren wie maschinelles Lernen (ML), 
d. h. Verfahren, die aus Beispielen lernen können, können Lösungen zu Problemen 
finden, die einen hohen Grad an Flexibilität in Wahrnehmung und Handlung erfor- 
dern. Die Verfügbarkeit großer Datenmengen (Big Data) und die stark gewachsene 
Rechenleistung haben diese Flexibilisierung gelernter Lösungen ermöglicht. Wie 
weitreichend diese Kl-Technologien bereits die Robotik prägen, zeigen etwa die Fort- 
schritte im autonomen Fahren. 


Moderne KI-Systeme bewegen sich freilich noch immer im Bereich der schwachen 
oder eingeschränkten KI (weak or narrow Al), die zwar ihre Funktionalität in einem 
abgesteckten Bereich verallgemeinern, nicht jedoch auf neue, unvorhergesehene 
Probleme übertragen kann. Auch wenn moderne, datengetriebene KI-Verfahren sehr 
viel flexibler etwa mit veränderlichen Umgebungsbedingungen und Rauschen in 
Sensordaten umgehen können, sind sie noch weit von den generellen Fähigkeiten 
eines Menschen, Probleme zu lösen, entfernt. 
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Marktpotenzial und aktuelle Entwicklungen in der Servicerobotik 


Die Servicerobotik ist ein Wachstumsmarkt. Die International Federation of Robotics 
(IFR) schätzt, dass zwischen 2018 und 2020 weltweit knapp 400.000 Serviceroboter 
im professionellen Bereich und knapp 43 Millionen Serviceroboter im Endkonsumen- 
tenmarkt zum Einsatz kommen werden und dass in dieser Zeit in den beiden Seg- 
menten knapp 23 Milliarden Euro bzw. knapp 16 Milliarden Euro umgesetzt werden 
(International Federation of Robotics 2017b). Laut IFR bedeutet dies für die kommen- 
den Jahre Wachstumsraten im zweistelligen Prozentbereich. 


Von insgesamt ca. 7 Milliarden Euro erzielten Umsätzen im Jahr 2017 hat der profes- 
sionelle Bereich, bezogen auf den Gesamtmarkt, einen Anteil von 62 Prozent (ca. 4,4 
Milliarden Euro Umsatz, ca. 80.000 verkaufte Einheiten) und der Endkonsumenten- 
bereich einen Anteil von 38 Prozent (ca. 2,6 Milliarden Euro, ca. 8,6 Millionen Ein- 
heiten). 


Betrachtet man die Marktabschätzungen zur Servicerobotik im gesamten professio- 
nellen zivilen Bereich (inkl. produzierender Industrie), kristallisieren sich drei Anwen- 
dungsbereiche heraus, die ein deutlich höheres Marktpotenzial versprechen als der 
Rest (siehe Abbildung 5.1). Die höchsten Umsätze wurden im Jahr 2017 im Gesund- 
heitswesen (Diagnostik, Chirurgie, Therapie und Rehabilitation) mit knapp 1,6 Milli- 
arden Euro erzielt. Dominiert wird dieser Bereich von der robotergestützten Chirurgie 
- ca. 70 Prozent aller verkauften Einheiten fallen in diese Kategorie. Die Feldrobotik 
und Logistik zeichnen sich durch ähnlich hohe Marktanteile aus mit jeweils ca. eine 
Milliarde Euro im Jahr 2017, wobei der Logistik ein leicht stärkeres Wachstum in den 
nächsten Jahren vorhergesagt wird. Umsatzmotor in der Feldrobotik waren 2017 
ganz klar Melkroboter (ca. 83 Prozent aller verkauften Einheiten in diesem Segment) 
und in der Logistik fahrerlose Transportfahrzeuge (FTF) außerhalb des Fertigungsbe- 
reichs (ebenfalls ca. 83 Prozent aller verkauften Einheiten in diesem Segment). 


Zusammen ergeben diese drei spezifischen Roboterarten Chirurgieroboter, Melkro- 
boter und FTF etwa die Hälfte aller abgesetzten Servicerobotik-Einheiten im professi- 
onellen Bereich. Alle drei Anwendungsfälle verbindet, dass sie von der Aufgaben- 
struktur noch der klassischen Industrierobotik ähneln, also die Anforderungen an 
flexible Wahrnehmung und Handlungssteuerung noch überschaubar sind. Chirurgie- 
roboter werden fast vollständig von Ärzten ferngesteuert, Melkroboter unterschei- 
den sich von klassischen Melkmaschinen nur durch das automatische Andocken am 
Euter der Kuh, und FTF fahren feste Routen in Industriegebäuden ab, in denen sich 
die Sichtverhältnisse kaum ändern. 


Das projizierte Wachstum hingegen wird auf neue Anwendungsfälle zurückzuführen 
sein, die einen höheren Grad an Autonomie erfordern und in denen die KI ihre flexi- 
bilisierendes Potenzial voll entfalten kann. 
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Abbildung 5.1: Marktpotenzial in den fünf umsatzstärksten Segmenten der Servicerobotik. Das Jahr 2017 stellt eine vorläufige Schätzung 
dar. Die Umsatzzahlen für die Jahre 2018 bis 2020 basieren auf einer Interpolation der geschätzten Gesamtumsätze für die drei Jahre unter 
Annahme einer konstanten jährlichen Wachstumsrate in den einzelnen Segmenten (Quelle: Buchholz et al. 2018, Daten aus: International 
Federation of Robotics 2017b). 
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Start-up-Investitionen als Maß für Marktreife 


Das Zusammenspiel von Kl-Methoden mit robotischen Systemen ist bereits seit den 
1950er Jahren Gegenstand der Forschung. Die Anzahl an wissenschaftlichen Publika- 
tionen mit KI und Robotik im Fokus hat seitdem exponentiell zugenommen (siehe 
Abbildung 5.2). Deutschland ist nach den USA das publikationsstärkste Land, wenn- 
gleich mit großem Abstand. 


Die kommerzielle Umsetzung der Forschungsergebnisse in Kl-gesteuerte Robotik- 
Produkte befindet sich demgegenüber noch immer in den Kinderschuhen. Das Ver- 
halten von Investoren im Start-up-Bereich kann hier als Indikator für die Marktreife 
herangezogen werden, da Start-ups oftmals als erste mit neuen Technologien in den 
Markt gehen. Erste zaghafte Investitionen in Robotik-Start-ups mit Kl-Bezug sind erst 
seit 2011 zu verzeichnen. Seitdem lässt sich hier allerdings ein exponentieller Anstieg 
erkennen. Im Jahr 2017 wurden bereits knapp zwei Milliarden US-Dollar in KI-Robo- 
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Abbildung 5.2a: Anzahl an wissenschaftlichen Publikationen zu den Themen KI und Robotik 
(eigene Darstellung, Daten aus Web of Science, Suchabfragebedingung: TS=(,artificial 
intelligence“ OR „machine learning“) AND TS=(robot*)). 
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Abbildung 5.3: Entwicklung weltweiter Investitionen in Start-ups, die Kl und Robotik adressieren (eigene Darstellung, Daten aus: 


wwvw.crunchbase.com). 
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Abbildung 5.2b: Anzahl an Institutionen mit Publikationen zu den Themen KI und Robotik (eigene Darstellung, Daten aus Web of 


Science, Suchabfragebedingung: TS=(„artificial intelligence“ OR „machine learning“) AND TS=(robot*)). 
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Verteilung von Investitionen in Start-ups in Europa 


Österreich Schweiz 
11 Mio. $ 11 Mio. $ 


Russland 
5 Mio. $ 


Frankreich 
1 Mio. $ 
Vereinigtes Königreich Schweden 
71 Mio. $ 3 Mio. $ 


Abbildung 5.5a: Europäische Start-ups im Bereich Robotik und KI: Verteilung der bekannten 
Investitionssummen nach Ländern (eigene Darstellung, Daten aus: www.crunchbase.com, 
betrachteter Zeitraum: 2011-2017). 


tik-Start-ups investiert (siehe Abbildung 5.3). Im internationalen Vergleich wird die 
Start-up-Szene vom nordamerikanischen und dem asiatischen Raum dominiert (siehe 
Abbildung 5.4).* 


Der Hauptfokus der erfolgreichsten Start-ups liegt auf der Anwendung von KI für 
autonomes Fahren wie z. B. Argo Al oder Brain Corporation und Endkonsumenten- 
Roboter für Haushalt und Entertainment wie etwa ROOBO, Rokid und Anki. Aller- 


3 Berücksichtig wurden alle Einträge der auf www.crunchbase.com verzeichneten Investiti- 
onsrunden zwischen 2011 und 2017 von Start-ups, die den Kategorien „Artificial 
Intelligence” und „Robotics“ zugeordnet sind. Datum der Abfrage: 21.02.2018) 
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Start-ups in Europa 
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Abbildung 5.5b: Europäische Start-ups im Bereich Robotik und KI: Start-ups nach Größen der 


bekannten Investitionssummen (eigene Darstellung, Daten aus: www.crunchbase.com, 


betrachteter Zeitraum: 2011-2017). 


dings finden sich auch erste Start-ups mit hohen Investitionssummen im Umfeld der 


Produktion (z. B. Preferred Networks). 


Im europäischen Vergleich fallen die Investitionssummen deutlich geringer aus. Briti- 
sche Start-ups führen das Feld in Europa an, deutsche hingegen verzeichneten bis 
Ende 2017 noch keine nennenswerten Investitionssummen (siehe Abbildung 5.5). 
Dass das deutsche Logistikroboter-Start-up Magazino Anfang 2018 eine Finanzie- 
rungsrunde in Höhe von 20,1 Millionen Euro abschloss“ ist in hier noch nicht erfasst. 


#4 httos://www.handelsblatt.com/unternehmen/industrie/lagerroboter-zalando-steigt-bei- 
vorzeige-start-up-magazino-ein/21007764.html, zuletzt geprüft am 22.06.2018 
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Auch europäische Start-ups konzentrieren sich auf das autonome Fahren wie z. B. Five 
Al oder Almotive und Haushalts- und Entertainmentroboter für den Endverbraucher 
(z.B. Emotech, Furhat Robtics). Andere europäische Start-ups entwickeln Kerntechno- 
logien. So widmet sich beispielsweise Prowler.IO dem „decision making”, einer Grund- 
voraussetzung für die Aktionsplanung, während andere Unternehmensneugründun- 
gen Computer Vision-Technologien für die Robotik erarbeiten. Jedoch gibt es bereits 
auch vereinzelte Start-ups, die konkrete Produkte in anderen Anwendungsbereichen 
konzipieren. Gamaya beispielsweise findet Robotiklösungen für den landwirtschaftli- 
chen Sektor, Robart konzentriert sich auf Navigation von Reinigungsrobotern, und 
EiraTech, Magazino und RoboCV entwickeln Robotikprodukte für die Intralogistik. 


Die Diskrepanz bei den Start-up-Investitionen zwischen Kontinentaleuropa, dem 
englischsprachigen Raum (Großbritannien und insbesondere den USA) und Asien 
belegt zum einen, dass Deutschland und anderen Ländern Kontinentaleuropas wie in 
den meisten Bereichen angewandter digitaler Innovation eine Außenseiterrolle 
zukommt. Andererseits belegen der Anstieg von Start-up-Investitionen weltweit und 
die zunehmende Diversifizierung der Anwendungsfälle, dass Kl-Innovationen der 
Robotik tatsächlich neue Märkte und Anwendungsszenarien eröffnen, und dass die- 
ses Marktpotenzial auch in Europa genutzt wird. 


Der Innovationshorizont für Kl-getriebene Robotik lässt sich an Beispielen aus der 
Landwirtschaftsrobotik (Feldrobotik) sowie der Medizin- und Pflegerobotik erken- 
nen. Ein Vergleich dieser beiden Bereiche ist überaus interessant: Einerseits haben die 
aktuellen Servicerobotik-Hardwareplattformen bereits in beiden Bereichen einen sehr 
hohen technologischen Reifegrad erreicht. Allerdings leidet deren breite Anwendung 
noch an einem Mangel an zuverlässigen Algorithmen für die intelligente Sensorda- 
tenverarbeitung und adaptive Steuerung. Hier kann die moderne KI ihre flexibilisie- 
rende Funktion wahrnehmen. Anderseits stehen beide Bereiche vor teilweise sehr 
unterschiedlichen Herausforderungen. So ist die Mensch-Maschine-Interaktion ein 
zentraler Faktor für die Medizin- und Pflegerobotik, nicht jedoch für die autonome 
Feldrobotik. 


Intelligente Roboter in der Landwirtschaft 


Während autonome Fahrzeuge erst zögerlich im Straßenverkehr auftauchen, sind 
auf den Feldern dieser Welt schon seit Jahren halbautonom gesteuerte Landwirt- 
schaftsmaschinen unterwegs. Dank GPS, optischen Sensoren und ausgefeilter Rege- 
lungstechnik können sie einer vorgegebenen Spur automatisch folgen — auf wenige 
Zentimeter genau. Allerdings sind solche Hightech-Landmaschinen bislang nur für 
Großbetriebe rentabel. Sie sind sehr groß und sehr teuer und können nur einfache, 
isolierte Arbeitsschritte wie z. B. Mähdreschen und Säen ausführen, die kein weiteres 
autonomes Verhalten erfordern (International Federation of Robotics 2017b). 
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Dank neuer KI-Technologien finden jetzt jedoch auch kleinere und vielfältiger ein- 
setzbare Serviceroboter den Weg in die Landwirtschaft (Wölbert 2017). Diese leich- 
ten und kostengünstigeren Feldroboter profitieren insbesondere von den KI-Techno- 
logien Computer Vision, ML sowie Aktionsplanung und Optimierung (siehe Abbil- 
dung 5.6), die eine autonome Navigation auf dem Acker überhaupt erst möglich 
machen. Von dieser Entwicklung profitieren auch kleinere Landwirtschaftsbetriebe, 
und der Trend zu kleinen Feldrobotern könnte diese Maschinen sogar bald auch 
attraktiv für die Bewirtschaftung von privaten Gärten machen (Joe Jones 2017). 


Das Aufgabenspektrum, das die neuen Kl-getriebenen Feldroboter bereits heute 
erledigen und künftig noch besser werden meistern können, wächst von Tag zu Tag. 
So werden Drohnen genutzt, um optische Aufnahmen vom Feld zu machen, auf 
denen mit Hilfe von Computer Vision-Algorithmen relevante Objekte wie Früchte, 
Schädlinge und Unkraut) und Parameter (Pflanzendichte) detektiert werden können 
(z. B. Lottes et al. 2017). Fortschritte in der Aktionsplanung ermöglichen präzise 


AUFGABEN DER ROBOTIK 


Navigation über das Feld (Flugroboter) oder im Feld 
ohne Schaden anzurichten (Landroboter), z.B. für 
Aufklärung, auch für landwirtschaftlichen Einsatz 


Bildaufnahmen des Feldes sammeln und darauf Objekte 
(z.B. Unkraut, Schädlinge, reife Früchte) und Größen (z.B. 


; f Pflanzdichte, Schädlingsbefall) erkennen 


3 Precision Farming: Aufgaben mit genauem Einsatzort, 
-zeit oder -art bestimmen und automatisch durchführen 


Maschinelles Lernen $ Pi (z.B. düngen, säen, Bewuchs ausdünnen, Pflanzenschutz) 


Aktionsplanung a S Präzise Manipulation von Objekten (z.B. empfindliche 
und Optimierung | pa Br oder schwer greifbare Früchte ernten, Pflanzen zurück- 
Ai schneiden, Unkraut jäten) 


Koordiniertes Schwarmverhalten von Feldrobotern 
(z.B. beim Säen, Pflanzenschutzmittel verteilen) 


Karten während autonomer Navigation anlegen 
(z.B. Bepflanzungskarten) 


Abbildung 5.6: Neue Kl-Technologien eröffnen der Landwirtschaftsrobotik neue Aufgaben- 
felder. 
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Manipulationen wie das Ernten von empfindlichen Früchten (van Henten et al. 2002) 
oder das Zuschneiden von Nutzpflanzen (Ackermann 2012). Und schließlich können 
Feldroboter ihre Aktivitäten mitschreiben und z. B. Bepflanzungskarten automatisch 
generieren. 


Der Landwirtschaft stehen inzwischen sehr umfangreiche Sensordaten über die aktu- 
ellen Zustände auf den Feldern zur Verfügung, die von Kl-Algorithmen ausgewertet 
optimale Handlungsentscheidungen ermöglichen (Sfiligo 2016). Ein Beispiel für sol- 
ches „Precision Farming” ist die Installation von Stickstoffsensoren, die regelmäßig 
Daten über den lokalen Zustand des Bodens übermitteln. Daraus lässt sich ein geziel- 
tes Düngen ableiten, ggf. punktuell nur dort, wo ein Stickstoffmangel festzustellen 
ist. Das senkt Kosten (weniger Dünger), ist effektiver (Überdüngung wirkt sich nega- 
tiv auf den Ertrag aus) und schont nebenbei auch die Umwelt (Adamchuk et al. 
2004). Moderne datengetriebene KI-Verfahren zur Aktionsplanung und Optimierung 
können neben Sensordaten vom Feld auch Vorwissen wie Bepflanzungskarten und 
externe Datenquellen wie z. B. Wetterdaten in die Entscheidungsfindung miteinbe- 
ziehen und damit die Landwirtschaft noch effektiver, präziser und wirtschaftlicher 
machen. Autonomen Feldrobotern kommt hierbei die wichtige Rolle zu, die einzel- 
nen Handlungsschritte automatisch sowie zeitlich und örtlich präzise umzusetzen. 


Bei kleinen Feldrobotern werden auch Roboterschwärme erforscht (King 2017) oder 
sogar schon angewandt (Wölbert 2017). Auch dies macht die autonome Feldrobotik 
attraktiver für kleine Landwirtschaftsbetriebe, die in Gruppen oder Kooperativen ein- 
zelne Landwirtschaftsroboter kaufen können, um sie dann für flächendeckende Ein- 
sätze, z. B. für die Saat, zu Schwärmen zusammenzufügen (King 2017). Die Koordi- 
nation von Gruppen autonomer Roboter ist eine weitere Herausforderung für die Kl 
in Aktionsplanung und Optimierung. 


Neben dem beschriebenen Trend zu kleineren autonomen Feldrobotern wird auch 
eine zunehmende Vielseitigkeit der Funktionalität von Feldrobotern kleinen Land- 
wirtschaftsbetrieben zugutekommen. Fortschritte in Kl-Technologien wie ML machen 
es möglich, ein und dieselbe Roboterplattform auf mehrere landwirtschaftliche Auf- 
gaben zu trainieren, etwa das Ernten verschiedener Früchte und das Versprühen von 
Pflanzenschutzmitteln (van Henten et al. 2002; Tobe 2014). Die Anschaffung eines 
autonomen Feldroboters, der verschiedene Arbeiten bewältigen kann, wird sich 
schneller rentieren. 


Die Beispiele zeigen, dass die durch KI erweiterte Flexibilität und erhöhte Autonomie 
von Feldrobotern immer noch überschaubar ist - zumal, wenn man sie mit der Fähig- 
keit von Menschen, Probleme zu lösen, vergleicht. Kl-Verfahren und autonome Feld- 
roboter können menschliche Entscheidungen optimieren und eine ständig wachsende 
Bandbreite von in der Landwirtschaft notwendigen Handlungsschritten autonom aus- 
führen. Den Menschen als Entscheider ersetzen können sie jedoch in keiner Weise. 
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Intelligente Roboter in Medizin und Pflege 


Im Unterschied zur Landwirtschaft warten in Medizin und Pflege Herausforderungen 
ganz anderer Art auf KI und Robotik, denn hier sollen autonome Roboter mit Men- 
schen interagieren können. Selbstverständlich gibt es auch in diesem Bereich Ein- 
satzfälle einfacherer Art, z. B. in der Gebäudereinigung, der Entsorgung von medizi- 
nischem Müll oder der Organisation medizinischer Güter (International Federation of 
Robotics 2017b). Solche Anwendungen unterscheiden sich jedoch wenig von ande- 
ren Aktivitäten in der Logistik generell. Hier liegt der Fokus daher auf Servicerobo- 
tern, die mit Menschen interagieren. 


Roboter können Menschen auf einer rein körperlichen Ebene behandeln, wie bei der 
Präzisionschirurgie, der intelligenten Prothetik oder auch bei chirurgischen Schulun- 
gen. Dabei erstreckt sich die Autonomie der Roboter hauptsächlich auf das Bereini- 
gen und Korrigieren, etwa zur Stabilisierung der menschlichen Bewegungen (Inter- 
national Federation of Robotics 2017b). Relevant für diese Anwendungsfälle sind 
hauptsächlich die Kl-Technologien ML, Computer Vision, Aktionsplanung und Opti- 
mierung. 


Technologisch anspruchsvoller sind Systementwicklungen, die eine Mensch-Roboter- 
Interaktion beinhalten. Hierbei soll etwa ein Assistenz- oder Rehabilitationsroboter 
als autonomer Agent mit einem Menschen kooperieren (International Federation of 
Robotics 2017b). Zu unterscheiden sind dabei die physische Interaktion (Ikemoto et 
al. 2012), in der Mensch und Roboter einander berühren oder sich zusammen bewe- 
gen, und der verbale Austausch, bei dem Roboter und Mensch sich auch sprachlich 
verständigen. In der Mensch-Roboter-Interaktion ermöglichen neue Kl-Methoden 
eine Flexibilisierung der sensorischen Datenverarbeitung (Wahrnehmung), der Akti- 
onsplanung und der Handlung. Zusätzlich zur Umgebung muss auch der Mensch als 
Akteur modelliert und interpretiert werden: menschliches Wohlbefinden wie Emoti- 
onen oder Gesundheit und menschliche Ziele wie Intentionen gilt es aus den Sensor- 
daten abzuschätzen und durch robotische Handlungen zu unterstützen. Auf sich 
schnell ändernde Bewegungen und Reaktionen des Menschen muss der Roboter in 
Echtzeit eingehen. Hierfür bedarf es neben Computer Vision, ML, Aktionsplanung 
und Optimierung auch neuer Kl-Technologien in den Bereichen Kognitive Modellie- 
rung, Natural Language Processing (NLP) und Semantische Technologien (siehe 
Abbildung 5.7). 


In Japan, wo die Akzeptanz für robotische Assistenzsysteme sehr viel höher ist als in 
Deutschland, werden in der Altenpflege schon seit mehr als zehn Jahren robotische 
Haustiere eingesetzt, die sehr einfache Verhaltensschaltkreise haben (Rabe und Kohl- 
bacher 2015). Auch in anderen Bereichen können soziale robotische Assistenzsys- 
teme hilfreich sein, z. B. bei autistischen Kindern, die in manchen Fällen die Interak- 
tion mit einem Roboter der Interaktion mit Menschen vorziehen (Feil-Seifer und 
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AUFGABEN DER ROBOTIK 


Automatisches Erfassen und Analysieren von Bild- 
und Tonaufnahmen des Patienten für Assistenz, 
Diagnose und Rehabilitation (z.B. Symptome klassifizieren, 
Emotionserkennung, Spracherkennung, Aktionserkennung) 


Körperliche Mensch-Roboter-Interaktion für Be- 

handlung, Assistenz, Rehabilitation (z.B. robotische Chi- 
rurgie, assistierte Physiotherapie, Roboter zum Bewegen 
nicht-mobiler Patienten) 


verbale Mensch-Roboter-Interaktion und seman- 
tische Inferenz für Behandlung für Behandlung, 
Assistenz, Diagnose und Rehabilitation (z.B. Assistenz- 
roboter in mentaler Gesundheit, Pflegeroboter im 
privaten Umfeld, Diagnoseassistenzsysteme) 


Abbildung 5.7: Neue KI-Technologien (Seifert et al. 2018) eröffnen der Medizin- und 
Pflegerobotik neue Aufgabenfelder. Die hier diskutierten Anwendungsfälle mit Bezug zur 
Mensch-Roboter-Interaktion sind farblich hervorgehoben. 
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Mataric 2011). Bekannt ist zudem, dass Kriegsveteranen sich häufig lieber von einem 
virtuellen Avatar als von einem Psychotherapeuten behandeln lassen, um der Stigma- 
tisierung ihrer mentalen Krankheit zu entgehen (Lucas et al. 2017). 


Solche robotischen „Companion“-Systeme, die Menschen in erster Linie körperlich 
oder emotional stützen, könnten in Zukunft vermehrt dazu genutzt werden, den 
Gesundheitszustand eines Patienten zu überwachen. Denn NLP, ML und Computer 
Vision sind zunehmend dazu fähig, Emotionen, mentale Zustände und Stress im All- 
gemeinen zu erkennen (El Kaliouby und Robinson 2004), zudem besonders auch 
Symptome körperlicher (Bartlett et al. 2014) und mentaler (Bedi et al. 2015) Krank- 
heiten einzuschätzen. Roboter-Companions könnten somit die zur Zeit bestehenden 
Versorgungslücken in der Überwachung von gefährdeten Patientinnen und Patien- 
ten schließen, da sie, im Gegensatz zu menschlichem Pflegepersonal, rund um die 
Uhr im vollen Umfang einsatzfähig sind und z. B. automatisch Alarm auslösen kön- 
nen, wenn sie einen kritischen Zustand erkennen. 


Auf Basis von Kl-Technologien zur intelligenten Interpretation solcher diagnoserelevan- 
ten Sensordaten könnten robotische Assistenzsysteme künftig auch direkt selbst ein- 
greifen, sei es, dass sie Patienten daran erinnern, bestimmte Aktionen durchzuführen 
wie etwa Medikamente einzunehmen, oder dass sie mit dem Patienten zusammenar- 
beiten. So könnten Rehabilitationsroboter - ähnlich einem „Serious Gaming”-Ansatz 
- einem Patienten motivierendes Feedback zu dessen Verhalten geben. Auch könnten 
Roboter Aufgaben übernehmen, die für menschliche Pfleger unangenehm sind, 
gesundheitsgefährdend oder sie gar überfordern, wie das Heben oder Bewegen nicht- 
mobiler Patientinnen und Patienten (International Federation of Robotics 201 7b). 


Je interaktiver eine geplante Roboteraufgabe ist, desto höher sind die Anforderun- 
gen an die Kl-Technologien, die menschlichen Aktionen und Intentionen nachzuvoll- 
ziehen und auf Reaktionen einzugehen. Hier kommen NLP-Technologien eine wich- 
tige Funktion zu, da Roboter, die bei der Schätzung menschlicher Verhaltensabsich- 
ten aufgrund von Beobachtung sehr unsicher sind, mittlerweile sogar klärend 
nachfragen können (Whitney et al. 2017; Ackermann 2017). 


Handlungsräume 


Für die noch relativ junge Servicerobotik kann KI zu einer Schlüsseltechnologie wer- 
den, die ihr einen breiten Einsatz in unterschiedlichsten Feldern ermöglicht. Gerade 
in Deutschland könnten Serviceroboter nicht nur in der Industrie dazu beitragen, die 
Produktivität zu steigern und nachhaltiger zu wirtschaften, sondern auch den demo- 
grafischen Wandel ausgleichen und außerhalb der Fabrikhallen in zentralen Berei- 
chen unserer Gesellschaft entlastend wirken. 
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In der Pflege besteht die Hoffnung, dass repetitive und physisch anstrengende Tätig- 
keiten in absehbarer Zeit auf Serviceroboter übertragen werden können. Als Compa- 
nions könnten Serviceroboter eine kontinuierliche Gesundheitsüberwachung von 
pflegebedürftigen Personen gewährleisten. Das ohnehin knappe Pflegepersonal 
könnte sich dann verstärkt den Kernaufgaben wie der Fürsorge widmen; Tätigkeiten 
also, bei denen für die nächsten Jahrzehnte nicht erkennbar ist, dass KI-Methoden 
hier auch nur ansatzweise den Menschen ersetzen könnten. 


In der Landwirtschaft erhöht ein zunehmender Preisdruck den Bedarf an effizienten 
Automatisierungsmethoden. Verschärft wird dies auch dadurch, dass das Interesse in 
der Gesellschaft abnimmt, einen Berufsweg in diesem Wirtschaftszweig zu suchen, 
sowie durch die Schwierigkeit für Landwirte, überhaupt Personal für Helfertätigkei- 
ten zu finden. Ähnliche Tendenzen zeigen sich auch im Straßenbau oder in der 
Abfallwirtschaft. 


Die Basis für eine schnelle Entwicklung von Servicerobotern als ständige Begleiter des 
Menschen wurde in der Kl-Grundlagenforschung der vergangenen Jahrzehnte 
gelegt. Die Verfügbarkeit der hierfür benötigten hohen Datenmengen sowie von 
großer Rechenleistung ist mittlerweile ebenfalls gegeben. Jetzt kommt es darauf an, 
die Kl-Methoden an die unterschiedlichen Anwendungen der Servicerobotik anzu- 
passen. 


Beim autonomen Fahren geht heute schon ein rasanter Fortschritt mit steigenden 
Investitionen einher. Die weitere Beschleunigung der Entwicklung in diesem Anwen- 
dungsgebiet bedarf aufgrund des hohen Marktpotenzials nur geringer innovations- 
politischer Eingriffe, wie auch die Entwicklungen des Investitionsverhaltens im Start- 
up Bereich unterstreichen. Die Märkte in Landwirtschaft, Medizin und Pflege hinge- 
gen sind noch deutlich kleiner und die Anwendungsfälle deutlich heterogener. Hier 
sind konzentrierte innovationspolitische Interventionen sinnvoll, um die Kl-gesteuerte 
Servicerobotik auf den Weg zu bringen. 


Wie in vielen anderen Bereichen angewandter neuartiger digitaler Technologien feh- 
len auch in der Kl-gesteuerten Servicerobotik junge innovative Unternehmen, um das 
große Potenzial zu nutzen, das in der Kl-Wissenschaft in Deutschland vorhanden ist. 
Der Kontrast zu den USA und asiatischen Ländern ist enorm, aber auch im europäi- 
schen Vergleich hinkt Deutschland deutlich etwa hinter Großbritannien her. Um diese 
Kluft zu schließen, sind fokussierte innovationspolitische Anreize für den Know-how- 
Transfer von der in Deutschland gut aufgestellten KI- und Robotik-Forschung (EFI 
2018; Seifert et al. 2018) in die Wirtschaft notwendig. Dies gilt besonders für Märkte 
wie Gesundheitsrobotik und Landwirtschaftsrobotik, in denen der Bedarf enorm ist. 
Die technologischen Voraussetzungen für marktreife Produkte der Servicerobotik 
sind gegeben. 
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Ausblick 


Künstliche Intelligenz und Robotik sind aktuell Megathemen der öffentlichen 
Debatte. Die tatsächlich signifikanten Durchbrüche in Kl-Technologien wie ML und 
Computer Vision werden in den Medien jedoch gelegentlich zum Ausgangspunkt 
überbordender Fantasien für übertriebene Projektionen des Möglichen in der 
Zukunft, in der Roboter - ob zum Guten oder zum Schlechten - bald schon einen 
Großteil der heute von Menschen ausgeübten Tätigkeiten bewältigen können 
(Brooks 2017). Dies schürt vor allem Ängste vor massiven Arbeitsplatz- und auch 
Kontrollverlusten zugunsten digitaler Akteure und Entscheider. Bei kaum einem 
anderen Technologiethema ist die Kluft zwischen solchen Prophezeiungen und den 
tatsächlichen Möglichkeiten größer. 


Das in den Medien gezeichnete Bild ist deshalb übertrieben und falsch, weil die kol- 
portierten Fortschritte bisher vor allem im Bereich der schwachen oder eingeschränk- 
ten KI erzielt wurden. Moderne Kl-Algorithmen funktionieren nur in einem eng 
abgesteckten Anwendungsfeld. Maschinelle Lernverfahren erkennen Strukturen in 
Übungsdaten und können auch Lücken füllen, aber sie verstehen nicht die Bedeu- 
tung des Gelernten und können ihr Wissen deshalb nicht auf neue, unbekannte 
Situationen übertragen. 


Als beispielsweise der französische Präsident Emanuel Macron seine Wähler mit 
„Mes chers compatriotes” („Meine lieben Landsleute”) ansprach, wurde dies von 
Microsofts Bing Übersetzer als „My fellow Americans” (meine amerikanischen Mit- 
bürger) ins Englische übertragen (Bryson 2017). Der Kl-Algorithmus hatte gelernt, 
dass „Landsleute“ im englischsprachigen Raum statistisch betrachtet meist „Ameri- 
kaner” bedeutet, und verwendet die Worte deshalb als Synonyme. Auch gab es im 
Jahr 2016 in Florida einen tödlichen Autounfall mit einem autonom gesteuerten 
Pkw, der mit hoher Geschwindigkeit in einen quer die Straße kreuzenden Sattel- 
schlepper hineinsteuerte, weil das Computer Vision-System diesen nicht erkannt 
hatte (Greenemeier 2016). Der Hersteller Tesla vermutet, dass das Computer Vision- 
System den Sattelschlepper aufgrund seiner weißen Farbe für einen Wolkenhimmel 
gehalten hat (Greenemeier 2016). Solch ein Fehler hätte einem menschlichen Fahrer 
nicht passieren können, der weiß, was Hindernisse sind, und deshalb auf jedes 
Objekt, das sich beim Näherkommen visuell ausdehnt, mit Bremsen reagiert. Diese 
Beispiele zeigen das fehlende Verständnis des Gelernten bei KlI-Systemen auf, was 
deren Möglichkeiten zur intelligenten Entscheidungsfindung stark einschränkt. 


Um die Fähigkeiten einer schwachen KI auf neue, unvorhergesehen Situationen zu 
übertragen, müssen also immer noch menschliche Ingenieure Hand anlegen und die 
Architektur nachbessern oder neue Trainingsdaten bereitstellen. Die Entwicklung von 
Robotern, die wie Menschen eigenständig, kreativ und flexibel auf neue, unvorher- 
gesehene Situationen reagieren, d. h. die von einer starken oder generellen KI (strong 
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or general Al) gesteuert werden, ist deshalb trotz massiver Fortschritte in maschinel- 
lem Lernen noch nicht absehbar (vgl. Brooks 2017). 


Deshalb sind auch aufkommende Sorgen in der Bevölkerung, dass Arbeitsplätze an 
autonome, Kl-gesteuerte Roboter verloren gehen könnten, bis auf wenige Ausnah- 
men unbegründet. Es gibt keine Evidenz dafür, dass Kl, Industrie 4.0, digitale Tech- 
nologien und Robotik nachhaltig Arbeitsplätze kosten (Graetz und Michaels 2015). 
Diese Angst hat sich allerdings inzwischen schon festgesetzt und folgt einem histo- 
risch bekannten Muster (Mokyr et al. 2015). KI, Robotik und andere Automatisie- 
rungstechnologien vernichten in der Regel keine Arbeitsplätze, sie ersetzen aller- 
dings vorhandene Tätigkeiten (Autor et al. 2003; Spitz-Oener 2006). Dadurch ver- 
schieben sich die Arbeitsinhalte von Mitarbeitern oft hin zu anspruchsvolleren 
Arbeiten (Wischmann und Hartmann 2018). 


Es wäre zu begrüßen, wenn sich der öffentliche Diskurs weniger an unrealistischen 
Bedrohungsszenarien orientiert, sondern die viel weitreichenderen gesellschaftlichen 
Möglichkeiten der Kl-gesteuerten Servicerobotik ins Auge fassen würde. Wie die 
angeführten Beispiele zeigen, sind die in fünf bis zehn Jahren zu erwartenden Ser- 
viceroboter nicht nur wirtschaftlich gesehen kurz- und mittelfristig vorteilhaft (Erhö- 
hung der Produktivität), sie werden auch zumeist Arbeiten übernehmen, die Men- 
schen entweder nicht übernehmen können oder wollen - unangenehme, schwere 
oder repetitive Tätigkeiten, Beschäftigungen, die eine durchgängige Aufmerksam- 
keit und Arbeitsbereitschaft erfordern, oder Arbeiten, deren Präzision jenseits des 
menschlich Möglichen liegt. Zudem können Kl-gesteuerte Serviceroboter einen gro- 
Ben Beitrag zur Nachhaltigkeit leisten (beispielsweise ökologische Landwirtschaft), 
von der auch künftige Generationen profitieren werden. 


Auch hinsichtlich der langfristigen Perspektiven des Fortschritts in KI und Robotik 
sind die aktuellen Debatten wahrscheinlich nicht zielführend. Während ein Durch- 
bruch in starker KI — Voraussetzung für die beschriebenen Angstszenarien - noch in 
keiner Weise abzusehen ist, werden in Forschung und Entwicklung auf Basis der 
schwachen KI andere futuristisch anmutende Anwendungsbeispiele für Roboter 
untersucht, die völlig neue Mehrwerte für unsere Gesellschaft generieren könnten. 
Im Bereich Landwirtschaft könnten Roboter beispielsweise Seetangfarmen in den 
Ozeanen bewirtschaften, deren Ernteertrag etwa zur Erzeugung erneuerbarer Ener- 
gien genutzt werden könnte (Ackermann 2017b). In der Medizin könnte die noch 
junge Disziplin der Mikrorobotik es ermöglichen, Krankheiten im Inneren des mensch- 
lichen Körpers mit Hilfe sehr kleiner autonomer Roboter gezielt zu behandeln und 
Lebensprozesse zu erforschen (Sitti et al. 2015). Zu hoffen wäre unter anderem auf 
völlig neue Perspektiven in der minimalinvasiven Krebstherapie. 


Kl-Technologien wie Machine Learning und Computer Vision haben das Potenzial, 
der Servicerobotik neue Anwendungsmöglichkeiten und neue Märkte zu eröffnen. 
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Die menschliche Vorstellungskraft bleibt allerdings gern im Rahmen dessen, was aus 
eigener Erfahrung bekannt ist, und mangelnde Kenntnis des Neuen lässt Fantasien 
aus der Science-Fiction von Robotern entstehen, die wie Menschen agieren können. 
Derartige angsterzeugende Szenarien sind unrealistisch und verschleiern das tatsäch- 
liche vorhandene enorme Potenzial der Kl-gesteuerten Robotik, die Gesellschaft, den 
Alltag, die Arbeit, die Wirtschaft und die Umwelt positiv zu beeinflussen. Hier gilt es 
gegenzusteuern. 
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6. E-Governance: Digitalisierung und Kl in der öffentlichen 
Verwaltung 


Leo Wangler, Alfons Botthof 


Die Digitalisierung und darauf aufbauend KI eröffnet völlig neue Möglichkei- 
ten, Prozesse zu vereinfachen, effizienter zu gestalten und intelligent zu auto- 
matisieren. Dort, wo entsprechende Voraussetzungen gegeben sind respek- 
tive geschaffen wurden und Prozesse einen Kl-Einsatz nahelegen, können 
Technologien der KI gerade auch im Bereich der öffentlichen Verwaltung 
hohes Potenzial eröffnen. Erfahrungen aus der Privatwirtschaft zeigen, dass 
sich Chancen ergeben, in einer Welt mit steigenden Anforderungen, hoher 
Arbeitsbelastung und Fachkräftemangel viele - meist monotone und zeitfres- 
sende - Tätigkeiten neu zu gestalten. Doch welche wesentlichen Vorausset- 
zungen müssen für den Einsatz von KI in der öffentlichen Verwaltung erfüllt 
sein? 


Wie auch in der freien Wirtschaft ist zum Beispiel die Digitalisierung und intelligente 
Vernetzung der Systeme bei der E-Governance von zentraler Bedeutung. Nur so lässt 
sich eine fundierte und durchgängige Datengrundlage für die Anwendung von KI- 
basierten Systemen herstellen. Neben der Frage der Infrastruktur muss auch in Impli- 
kationsprozessen auf die Qualifizierung der betroffenen Verwaltungsmitarbeiter und 
auf die Akzeptanz von Nutzerinnen und Nutzern Wert gelegt werden. 


Der Blick in die Praxis zeigt, dass Sicherheits-, Justiz- und Sozialbehörden zunehmend 
an Belastungsgrenzen stoßen und in absehbarer Zeit keine Besserung der Lage zu 
erwarten ist. Beispielsweise wird in der Steuerverwaltung (DBB 2017) eine Perso- 
nallücke von 20 Prozent diagnostiziert. Vielerorts sind die Bürgerämter überlastet, 
mit den damit verbundenen Unannehmlichkeiten für Einwohner und Unternehmen. 
Anträge können nicht zügig bearbeitet werden, sodass Antragsteller in finanzielle 
Schwierigkeiten geraten können. Die Folgen sind Ärger und Frust, gepaart mit Unver- 
ständnis beim Steuerzahlenden. 


Eine Überlastung der Verwaltung ist auf Bundes-, Landes- und kommunaler Ebene zu 
beobachten. Die Probleme wurden durch die chronisch knappen öffentlichen Haus- 
halte verstärkt, was vielerorts zu Stellenkürzungen geführt hat - bei gleichzeitig 
gestiegenen Anforderungen und mit teilweise verheerenden Folgen. So hat etwa die 
Bundeshauptstadt Berlin im Zeitraum von 2003 bis 2017 knapp 30.000 Stellen in 
ihrer Verwaltung gestrichen (RBB 2017). Gleichzeitig verzeichnete die Stadt einen 
starken Zuzug, der den Druck auf die Verwaltungsmitarbeiter noch einmal deutlich 
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verstärkte. Arbeiteten 2003 in Berlin (Bezirke und Land) noch rund 40 Landesbe- 
dienstete je 1.000 Einwohner, sind es mittlerweile nur noch knapp 30. Es wurden 
Stellen eingespart, ohne die Arbeitsprozesse z. B. durch einen Ausbau der IT-Infra- 
struktur so zu verändern, dass die verbleibenden Mitarbeiter in der Lage wären, den 
Mangel an Personal zu kompensieren. Diese Überlastung hat Konsequenzen. Bei- 
spielsweise dauert es in Berlin aktuell ca. drei Wochen, um ein Fahrzeug anzumelden 
(Tagesspiegel 2017a). Allein die Beantragung eines Personalausweises kann länger 
als einen Monat dauern (FOCUS 2017). Ähnlich schlecht steht es um die Abwicklung 
von Verwaltungsakten für Unterhaltszahlungen (Tagesspiegel 2017d) oder die 
Ummeldung eines Wohnsitzes (Tagesspiegel 20170). 


Damit verbunden ist eine anwachsende Unzufriedenheit sowohl von Seiten der Bür- 
ger als auch bei den Mitarbeiterinnen und Mitarbeitern in den Ämtern der Behörden. 
Zurückzuführen ist diese im Wesentlichen auf Unzulänglichkeiten im Verwaltungsab- 
lauf. Indikator dafür ist die Bearbeitung von Standardanfragen. Wenn eine Routine- 
Berechnung zur Höhe einer Geldleistung zu viel Zeit in Anspruch nimmt, weil der 
Sachbearbeiter zu lange damit beschäftigt ist, die Dokumente auf Vollständigkeit zu 
überprüfen oder Daten manuell aus unterschiedlichen Systemen zusammenzutra- 
gen, ist dies immer ein Ausgangspunkt für Verbesserungen, zur Fehlerminimierung 
und Effizienzsteigerungen. Diese lassen sich wiederum nur durch zukunftsgerichtete 
Investitionen in die Digitalisierung der öffentlichen Verwaltung erzielen (Accenture 
2017). 


Doch Besserung ist bisher nicht in Sicht. Viele Bereiche der öffentlichen Verwaltung 
nutzen die Möglichkeiten einer leistungsfähigen IT-Infrastruktur und den Einsatz von 
Softwarelösungen nur unzureichend. Vieles, was anderswo am Computer und pers- 
pektivisch durch die KI erledigt wird, muss hier vielfach noch umständlich händisch 
ausgeführt werden. Erheblicher Personalabbau in Kombination mit fehlenden Inves- 
titionen in die IT-Infrastruktur und Software verschärfen bestehende Probleme. Ein- 
zelne Bundesländer haben sogar im IT-Bereich Stellen gestrichen (Tagesspiegel 
2017b). 


Im Gegensatz dazu sind andere Länder wie Dänemark (Handelsblatt 2018a) oder 
Estland (ZEIT 2017b) bei E-Governance-Anwendungen führend. Damit haben sie in 
der Vergangenheit wichtige Voraussetzungen geschaffen, um smarte Services anzu- 
bieten und künftig weitere Effizienzsteigerungen und intelligente Lösungen in Ver- 
waltungsabläufen zu erzielen und die Dienste im Sinne der Bürger zu verbessern. Der 
Aufbau der Infrastruktur und die gewonnenen Erfahrungen kommen allen Beteilig- 
ten, den Dienstleistern auf dem Amt wie auch den Bürgerinnen und Bürgern in die- 
sen Ländern auch bei den nächsten Schritten, wenn zunehmend Kl-gestützte Pro- 
zesse implementiert werden, zugute. 
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Voraussetzungen zur Nutzung der KI und aktueller Digitalisierungsstand 
der öffentlichen Verwaltung 


Der Prozess der Digitalisierung in der Wirtschaft ist ein wertvolles Fallbeispiel, aus 
dem sich Lehren und Erkenntnisse für die digitale Transformation der öffentlichen 
Verwaltung ableiten lassen. Die intelligente Vernetzung der industriellen Produktion 
haben etliche Unternehmen in den letzten Jahren systematisch vorangetrieben. Im 
Rahmen von Industrie 4.0 konnte sich dieser Prozess zu einem Erfolg versprechenden 
industriepolitischen Paradigma entwickeln. Dieser Vorgang dauert an und ist beson- 
ders in den KMU noch längst nicht befriedigend gelungen. Aber schon jetzt werden 
die Vorzüge der Industrie 4.0 augenfällig: Durch die intelligente Vernetzung der Sys- 
teme können Datenströme zusammengeführt werden und es fallen damit einherge- 
hend umfassende Datenmengen für unterschiedlichste Auswertungen an. Mit Hilfe 
von KlI-Techniken sind die Unternehmen nunmehr in der Lage, die durch den Einsatz 
vernetzter cyberphysikalischer Systeme entstehenden Daten systematisch zu analy- 
sieren und so zu nutzen, dass Prozessinnovationen, Produktinnovationen und/oder 
neue Geschäftsmodelle Realität werden können. Schließlich generiert KI als Erweite- 
rung von Industrie 4.0 neue Wachstumsimpulse (BMWi 2018). Mit Industrie 4.0 
wurde eine zentrale Voraussetzung dafür geschaffen, dass KlI-Methoden jetzt Einzug 
in industrielle Produktionsprozesse halten und hier zusätzliche Produktivitätsgewinne 
möglich machen (Brynjolfsson et al. 2017). 


Analogien lassen sich zur öffentlichen Verwaltung herstellen (siehe Abbildung 6.1). 
Auch die digitale Transformation der öffentlichen Verwaltung vollzieht sich in Stufen, 
die aufeinander aufbauen. Damit Kl in der öffentlichen Verwaltung erfolgreich ein- 
gesetzt werden kann, bedarf es einer erfolgreichen Implementierung von E-Govern- 
ment bzw. Verwaltung 4.0. Dabei ist Kl als technologiebasierte Methode zu verste- 
hen, mit dem sich heutige Prozesse effizienter gestalten und neue intelligente Dienst- 
leistungen entwickeln lassen. Analog zu Werkzeugen, die körperliche Arbeit 
erleichtern, unterstützt die KI die Wissensarbeit (Accenture 2017). Aber anders als 
das klassische (Hand-)Werkzeug kann KI in Arbeitsprozessen die menschliche Intelli- 
genz erweitern. In der Vergangenheit waren Supercomputer auch ohne KI-Algorith- 
men in der Lage, die besten menschlichen Schachspieler zu schlagen, und selbst 
mittelmäßige Schachspieler können im Team mit einem Computer gegen Supercom- 
puter gewinnen, sogenanntes Freestyle Chess (Behavioral Scientist 2017). Für ein 
Traditionsspiel wie Go reichten aber allein hohe Rechenleistungen nicht aus, um erst- 
klassige Go-Spieler zu schlagen. Erst Kl-Technologie, wie sie in der Software AlphaGo 
zum Einsatz kommt, war im Jahr 2017 in der Lage, gegen den amtierenden Welt- 
meister zu gewinnen. Dazu musste diese aufwendig im Spiel mit menschlichen Geg- 
nern trainiert werden. AlphaGo Zero benötigt selbst dieses menschliche Training 
nicht mehr (ZEIT 2017). 
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Die bisherigen Ausführungen zeigen, dass die Digitalisierung als Grundvorausset- 
zung für den KI-Einsatz in der öffentlichen Verwaltung zu sehen ist. Daher stellt sich 
zunächst die Frage, auf welchem Stand sich die Digitalisierung in Deutschland derzeit 
befindet. Kann Kl hierauf aufbauen und dazu beitragen, die eingangs beschriebenen 
Probleme zu beheben? Auskunft geben Daten des Global Innovation Index (GII 
2017).* Es zeigt sich, dass Deutschland zwar beim Zugang zur Informations- und 
Kommunikationstechnik (IKT-Technologien) sowohl im öffentlichen als auch im priva- 


ZUGANG ZU IKT 


E-PARTIZIPATION NUTZUNG 


VON IKT 


ONLINE-DIENSTE DER REGIERUNG 


=== GROßBRITTANNIEN === FRANKREICH == USA m SCHWEDEN == DEUTSCHLAND 


Abbildung 6.2: Ausgewählte Digitalisierungsindizes (Quelle: Daten des Gil, eigene Darstel- 
lung und Berechnungen). 


# Für den Vergleich der öffentlichen Verwaltung in Deutschland mit anderen Ländern 
wurden die Werte normiert, indem man sie in einen relativen Bezug zu dem Land setzte, 
das bei dem jeweiligen Indikator am besten abschneidet (der Wert des führenden Landes 
entspricht dann 100 Prozent). 
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ten Sektor sehr gut abschneidet, andererseits aber beim Online-Service von Regie- 
rung und Verwaltung relativ zu den Vergleichsländern (Frankreich, Schweden, Eng- 
land und USA) das Schlusslicht ist. Auch bei der Online-Partizipation und IKT-Nutzung 
(einschließlich des Privatsektors hat Deutschland Verbesserungsbedarf. 


Gleichzeitig zeigt sich anhand des Digitalisierungsindexes (D21), dass so viele Bürger 
wie nie zuvor über einen Zugang zum Internet verfügen. Von der Nachfrage her sind 
daher immer bessere Voraussetzungen gegeben, um E-Governance-Angebote aus- 
zuweiten (D21 2016). 


Dass Deutschland in der Digitalisierung der öffentlichen Verwaltung im Vergleich zu 
anderen Staaten weit abgeschlagen ist, verdeutlicht auch Abbildung 6.3. Der dort 
dargestellte Indikator zeigt, wie sich die Nutzung von E-Governance-Angeboten 
durch die Bürgerinnen und Bürger zwischen den Jahren 2006 und 2016 verändert 
hat. Gemessen wird, ob sie Dokumente per Internet an öffentliche Behörden senden. 
Zwar ist der relative Anteil in Deutschland von 9,4 Prozent im Jahr 2006 auf 17 Pro- 
zent im Jahr 2016 gestiegen - damit hat sich die Nutzung fast verdoppelt, was einem 
Wachstum von knapp einem Prozent pro Jahr entspricht. Allerdings ist Deutschland 
im internationalen Vergleich weit abgeschlagen. Wenn dieses Wachstum im gleichen 
Tempo weiterginge, würde es etwa bis zum Jahr 2100 dauern, bis bestimmte Verwal- 
tungsschritte vollkommen digitalisiert wären. In anderen Ländern wie etwa Däne- 
mark vollzog sich die Digitalisierung weitaus schneller. 


Im DESI-Ranking der EU, das die Digitalisierung der Wirtschaft und Gesellschaft 
abbildet (siehe Abbildung 6.4), findet sich Deutschland beim Teilindex Digitalisierung 
in der öffentlichen Verwaltung auf Platz 20 und liegt dabei 37,6 Prozent hinter dem 
führenden Estland. 


Doch warum ist Deutschland im internationalen Vergleich weit abgeschlagen? Ein 
Grund dafür ist sicherlich, dass in den vergangenen Jahren nahezu keine Gelder in 
Innovationen im öffentlichen Sektor geflossen sind (siehe Abbildung 6.5). Wie schon 
erwähnt, wäre das jedoch eine Grundvoraussetzung dafür, dass KlI-Methoden Mitar- 
beiter in der öffentlichen Verwaltung entlasten könnten. Dringend notwendig wären 
beispielsweise gezielte Förderprogramme für die öffentliche Verwaltung, die ähnlich 
wirksam wären wie die sehr erfolgreichen Industrie-4.0-Programme, die wichtige 
Grundlagen für die Digitalisierung in der industriellen Produktion geschaffen haben.“ 


Die Analyse der Daten zeigt, dass Deutschland bei der Digitalisierung in der öffentli- 
chen Verwaltung weiterhin Nachholbedarf hat. Es steht zu befürchten, dass auf- 


46 Spannend ist der Fall Dänemark: Dem Land konnte es offensichtlich gelingen, im Bereich 
der Digitalisierung in der öffentlichen Verwaltung zu den führenden Ländern aufzuschlie- 
Ben und gleichzeitig wurde dabei auf gezielte öffentliche Förderinstrumente verzichtet. 


128 B Anwendung 


oO 
-à 
o 
N 
© 
w 
oO 
> 
© 
vi 
o 


60 70 % 
DÄNEMARK 2 
ESTLAND 
ISLAND 
NORWEGEN 


FINNLAND 


| 


NIEDERLANDE 
FRANKREICH 
IRLAND 
SCHWEDEN 
OECD 
LUXEMBURG 
BELGIEN 
GROßBRITANNIEN 
ÖSTERREICH 
SPANIEN 
LETTLAND 
PORTUGAL 


GRIECHENLAND 


UNGARN 
— 2006 


= 2016 


TÜRKEI 
POLEN 


SLOVENIEN 


IM] 


DEUTSCHLAND 


Abbildung 6.3: Nutzung des Internets für die Übersendung von Formularen an die öffentli- 
che Verwaltung innerhalb der vergangenen zwölf Monate. Hier ist Deutschland im internati- 
onalen Vergleich weit abgeschlagen. Führende Länder sind Dänemark, Estland und Island 
(Quelle: OECD 2017, S. 203). 
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Abbildung 6.4: Digital Economy and Society Index (DESI)-Ranking der EU-Kommission zum 
Thema E-Governance (Quelle: EU 2018). 


grund dieser fehlenden Voraussetzungen wichtige Bedingungen für einen kurzfristi- 
gen Kl-Einsatz bislang nicht gewährleistet sind (siehe Abbildung 6.6). Damit KI- 
basierte Funktionalitäten wie Analysen, Optimierungen, intelligente Prozesssteuerung, 
etc. zunächst entwickelt und dann genutzt werden können, bedarf es einer Investiti- 
onsoffensive in die digitale Infrastruktur, die Entwicklung interoperabler Systeme und 
begleitender Qualifizierung. 
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(Quelle: OECD 2017, S. 201). 


Abbildung 6.5: Staatliche Unterstützungsangebote für Innovationen im öffentlichen Sektor im internationalen Vergleich 
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Abbildung 6.6: Der intelligent vernetzte Staat (Quelle: eigene Darstellung angelehnt an 
Lucke 2015, S. 11). Im roten Bereich bedarf es Investitionen, damit die öffentliche Verwal- 
tung unter Anwendung der KI effizienter funktionieren kann. 


132 B Anwendung 


Aus welchen Bausteinen im Einzelnen müsste eine Digitalisierungsoffensive im 
öffentlichen Sektor bestehen? Wie in Abbildung 6.1 und Abbildung 6.6 dargestellt, 
müssten in einem ersten Schritt die einzelnen Akteure wie Nutzer und Leistungser- 
bringer in den öffentlichen Verwaltungen über das Internet der Dinge bzw. durch die 
Nutzung cyberphysischer Systeme sehr viel stärker als bisher miteinander vernetzt 
werden. Und wenn das Internet der Dinge bewusst mit einbezogen würde, könnten 
selbst in jenen Bereichen, in denen bisher in erster Linie analog gearbeitet wird, die 
Prozesse mit den Möglichkeiten der Kl sehr viel effizienter ablaufen. 


Potenzial des Einsatzes der KI im öffentlichen Sektor 


Wenn es gelänge, die KI zukünftig nutzbringend in der öffentlichen Verwaltung ein- 
zusetzen, würde dies die Abläufe grundlegend verändern. Das Ergebnis: größere 
Produktivität, Geschwindigkeit und Nutzerfreundlichkeit der öffentlichen Verwaltung 
(z. B. Government Technology 2016). Hier nur einige wenige Beispiele, abgeleitet aus 
dem heutigen Aufgabenportfolio der Ämter: 


Kl-basierte Systeme sind in der Lage, immer komplexere Fragen von Bürgerinnen und 
Bürgern zu verstehen und zu verarbeiten (Chat-Bots oder FAQ-Bots), um Hilfen beim 
Ausfüllen von Formularen und spezifische Auskünfte eigenständig zu geben. Selbst 
fremde Sprachen bilden kein Hindernis mehr bei der Kommunikation mit Bürgerin- 
nen und Bürgern; digitale Assistenten unterstützen die Beschäftigten in den Behör- 
den bei Sprachproblemen in Echtzeit. Schriftliche Unterlagen, relevante Informatio- 
nen im E-Mail-Verkehr und mündliche Anfragen werden intelligent erkannt, autark 
bearbeitet oder an die zuständigen Stellen automatisch weitergeleitet. Eingereichte 
Unterlagen können auf Vollständigkeit und Angaben auf Plausibilität (vor)geprüft 
werden. Termine und Fristen werden systernseitig nachgehalten. Berechnungen zur 
Höhe finanzieller Ansprüche zu Sozialleistungen selbst bei nicht standardisierbaren 
Fällen können vorgenommen werden. Steuerrelevante Zahlungsvorgänge können 
durch Vernetzung künftig Steuererklärungen vereinfachen bis automatisieren. 


Ein zentrales Merkmal wird sein, dass künftig sehr viel mehr Routinetätigkeiten von 
der KI ausgeführt werden. Zum Beispiel die Anmeldung eines Kraftfahrzeugs: Künf- 
tig ist denkbar, dass bereits beim Kauf eines Fahrzeugs die relevanten Fahrzeugdaten 
durch intelligente Verknüpfungen vom Verkäufer autonom an das zuständige Amt 
übermittelt werden, benötigte Formulare auch auf Basis unvollständiger oder 
umgangssprachlich übermittelter oder anderweitig bereits vorliegender Informatio- 
nen erstellt werden und die Anmeldung dann nur noch einen formalen Akt darstellt, 
der wenige Minuten in Anspruch nimmt. Zeitfenster für Präsenz- oder Abholtermine 
könnten intelligent entsprechend den Kundenwünschen vorgeschlagen, und vom 
Bürger via App gebucht werden. 
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Ähnliche Kl-basierte Erleichterungen sind für viele weitere Verwaltungsvorgänge 
denkbar, wenn etwa persönliche Dokumente wie Personalausweis oder Führerschein 
neu ausgestellt werden müssen. Intelligente Systeme informieren über passende 
Termine. Perspektivisch werden digitale Assistenten die öffentliche Verwaltung 
unterstützen. Im Idealfall erfolgt die Kommunikation zwischen Bürger und Amt 
zukünftig über den intelligenten Assistenten. Bürgerinnen und Bürger selbst müssten 
in diesem Szenario nur noch abschließend prüfen, ob die richtigen Schritte eingelei- 
tet wurden und dies bestätigen. 


Die Verwaltung der Zukunft als Plattform 


Wie in anderen Bereichen der Wirtschaft auch lassen sich viele Interaktionen zwi- 
schen Bürgern und Ämtern künftig auf digitalen Plattformen umsetzen. Insbeson- 
dere eignen sich kommunale Internet-Plattformen, um aus Sicht der Bürgerinnen 
und Bürger Zeit und Kosten einzusparen. Dies bietet Städten ebenso wie Kommunen 
auf dem Land umfassende Möglichkeiten, ihre Beratungsleistungen völlig neu zu 
organisieren. Eigentlich gibt es keine Verwaltungsabläufe, die sich künftig nicht in 
einem digitalen Prozess abbilden ließen - nicht notwendigerweise in jedem Fall aber 
auch - mit Unterstützung von KI-Technologien. Die Beantragung eines Personalaus- 
weises oder die Ausstellung von Geburtsurkunden lassen sich über digitale Plattfor- 
men organisieren, vorausgesetzt der Datenschutz bleibt gewahrt (siehe hierzu auch 
Teil A, Beitrag 4) Solche digitalen Plattformen lassen sich vielfältig ausgestalten, um 
anfallende Daten im Sinne der Bürger auszuwerten und die Angebote der Behörden 
durch Einsatz von KI noch effizienter und bürgernäher zu machen (Handelsblatt 
2018b). In anderen Ländern ist das bereits Standard. Eine wichtige Voraussetzung für 
eine solche Entwicklung ist der digitale Personalausweis, denn er ermöglicht die 
Online-Authentifizierung. Individuelle Daten lassen sich mit ihm automatisiert in 
Online-Formulare übertragen. KI könnte dann die unterschiedlichen Informationen 
als kombinierbar erkennen, daraufhin zusammenführen und Prozesse weiter opti- 
mieren (eGovernment 2017). Digitale Plattformen sind somit eine wichtige struktu- 
relle Voraussetzung, um die Potenziale der KI für Effizienzsteigerungen in der öffent- 
lichen Verwaltung nutzbringend für die Bürger einzusetzen. 


Neue Formen der bürgernahen Kommunikation mit Verwaltungs- 
einrichtungen durch KI 


Im privaten Bereich finden sich schon heute „intelligente Lautsprecher”. Alexa, Siri, 
Cortana etc. vermitteln das Gefühl, jederzeit aufs Wort zu gehorchen und auf Wün- 
sche einzugehen. Niemand muss sich hier noch durch Menüs klicken oder Anliegen 
über die Tastatur eingeben. Derartige Benutzerschnittstellen verdeutlichen, welchen 
Vorteil bereits jetzt die „schwache“ KI bei der Spracherkennung und dem Zugriff auf 
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internetbasierte Wissensbestände bietet. Wie bei kommerziell betriebenen Call-Cen- 
tern oder bei fortschrittlichen Customer-Relation-Managementsystemen werden sich 
auch in der öffentlichen Verwaltung solche Interaktionsschnittstellen mit vorhande- 
nen und künftig verfeinerten KI-Technologien attraktiver und zuverlässiger gestalten 
lassen. Als Wegweiser durch den Bürokratiedschungel und als Auskunftssystem wird 
eine natürliche sprachliche Kommunikation und eine bedarfsgerechte Assistenz 
künftig auch hier nicht mehr wegzudenken sein. Damit „besteht die Chance, eines 
der wesentlichen Dilemmata öffentlicher Verwaltung zumindest in der Tendenz auf- 
zulösen: hochkomplexe Sachverhalte in ihrer Komplexität zu belassen und sie gleich- 
wohl mit einer Oberfläche auszustatten. Denn zu gewinnen gibt es am Ende viel: Die 
Akzeptanz staatlichen Handelns, die Wertschätzung unserer Demokratie ist von einer 
enormen Vielzahl von Faktoren abhängig. Und dazu gehören - selbstverständlich 
nicht an erster Stelle aber immerhin — auch kleine und mitunter nebensächliche All- 
tagserfahrungen - und wenn es eine zügige Terminvergabe auf dem Bürgeramt ist" 
(Minack 2017). 


Massenhaft anfallende Routinetätigkeiten lassen sich besonders elegant mit KI- 
Unterstützung bewältigen: etwa die Bereitstellung von Antragsformularen oder 
Beratung und Auskunft zu standardisierten sowie individualisierten Verwaltungspro- 
zessen, ebenso ein einfaches Terminmanagement oder die Berechnung von Leistun- 
gen für Arbeitslose. Mit Sprach- bzw. Dialekterkennungssoftware lässt sich im 
Umgang mit Migranten die Nationalität feststellen usw. All dies wird verbunden sein 
mit einer hohen Zufriedenheit bei all denen, die den Service der Verwaltung in 
Anspruch nehmen wollen oder müssen. 


KI-Anwendungen im Beschaffungswesen 


Das Beschaffungswesen ist in der öffentlichen Verwaltung ebenso komplex wie in 
Wirtschaftsunternehmen. Die damit verbundenen Daten liegen in der Regel unge- 
ordnet vor. Sie müssen also meist manuell strukturiert werden, damit die Sachbear- 
beiter sie effizient und mit einer geringen Fehlerquote verarbeiten können. Identifi- 
zierung, Beschreibung und Kategorisierung in der klassischen Weise zu gewährleis- 
ten ist mit einem enormen Aufwand verbunden und gehört sicherlich zu den 
ungeliebten Tätigkeiten. Aber ebenso wie in den Unternehmen lassen sich diese 
Arbeiten weitestgehend automatisieren; Mustererkennung und Entscheidungsfin- 
dung sind bereits heute etablierte KI-Funktionen. 


Für die im Beschaffungswesen anfallenden Aufgaben eignet sich die jeweils sinnvolle 
Kl-Technologie.* Infrage kommende Algorithmen beziehungsweise Methoden der 


# Ein Beispiel ist www.genpact.com, zuletzt geprüft am 24.07.2018 
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KI liegen inzwischen ausgereift vor. Packzettel, Lieferscheine, Faxunterlagen, telefo- 
nische oder Online-Bestellungen, Rechnungen sowie Mahnungen liefern dann Infor- 
mationen, die sich als „smarte Daten” nutzen lassen - so z. B. als Trainingsdaten, die 
automatisierte, sprachgesteuerte Systeme befähigen, an der Schnittstelle zu Kunden 
oder Lieferanten kommunikative Aufgaben zu übernehmen: „[...] Sprachgesteuerte 
Bots können Rechnungen oder Bestellungen annehmen oder fehlerhafte Liefermen- 
gen eigenständig korrigieren. Mithilfe von maschinellem Lernen (ML) und tiefem 
Lernen (Deep Learning, DL) passt sich das System immer besser an die unterneh- 
mensinternen Richtlinien an und lernt von der kontinuierlichen Interaktion mit 
Anwendern und Lieferanten. Mit je mehr Daten das System gefüttert wird, umso 
intelligenter wird es und kann die angelernte Wissensbasis nutzen, um alle Prozesse 
im Beschaffungsmanagement zu optimieren [...]” (Industry of Things 2018). Finanz- 
ämter, Ausländerbehörden oder das Bundesamt für Migration und Flüchtlinge könn- 
ten aktuell dankbare Anwender dieser Technologien werden. Die Identifikation und 
das Management von Engpässen im Verwaltungshandeln kann durch prädiktive Ver- 
fahren verbessert und dynamisch angepasst werden. 


Methoden des ML können das Sortieren von Datensätzen, beispielsweise also die 
Zuordnung unterschiedlich notierter oder in Varianten auftretender Rechnungen und 
Lieferscheinen sein, die sich aufgrund von fehlerhaften oder uneinheitlichen Schreib- 
weisen unterscheiden, obwohl sie eindeutig zu einer Institution oder Person gehö- 
ren. Die intelligente Vereinheitlichung geschieht dabei nach Regeln. 


Darüber hinaus ist es von hohem Interesse, auch eine inhaltliche Identifizierung und 
Klassifizierung zu erreichen. Hier kommt DL zum Zuge. „[...]. DL anhand von Wort- 
vektoren würde im Beschaffungsmanagement beispielsweise bedeuten, dass eine 
Rechnung mit der Betreffzeile ‚Plastik, 500ml, Evian’ automatisch als abgefülltes 
Wasser erkannt wird. Die richtige Zuordnung erfolgt rein auf Basis des Kontexts und 
durch die wachsende Erfahrung des lernenden Systems. Eine manuell dafür aufge- 
setzte Regel ist nicht notwendigl...]” (Industry of Things 2018). 


Fazit und Ausblick 


Die angeführten Beispiele geben einen Eindruck davon, wie die Kl im Sinne der Bür- 
gerinnen und Bürger die öffentlichen Verwaltungsabläufe verbessern kann. Wenn 
sich auch Kl-Technologien und -Methoden noch in der Entwicklung befinden, ist es 
dennoch notwendig, erste Schritte einzuleiten, um sie in der öffentlichen Verwaltung 
einzuführen. Dies betrifft insbesondere die intelligente Vernetzung der Kommunika- 
tionssysteme und die Datenarchitektur. Ein dynamisches Stufenmodell (siehe Abbil- 
dung 6.7) zeigt auf, wie die Digitalisierung in der öffentlichen Verwaltung weiter 
vorangetrieben und die Interaktion zwischen Bürgern und Verwaltung verbessert 
werden kann. 
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Abbildung 6.7: Stufenmodell zur digitalen Weiterentwicklung öffentlicher Verwaltungsange- 


bote, eigene Darstellung 


Der überfällige Anstoß für eine Digitalisierungsoffensive in der öffentlichen Verwal- 
tung ist mit umfangreichen Investitionen verbunden (s.o.). So gilt es, nach Investitio- 
nen in digitale Strukturen passgenaue Kl-basierte Dienstleistungen und Anwendun- 
gen zu entwickeln und die Grundlagen dafür zu schaffen, diese zukünftig immer 
mehr über digitale, vernetzbare Plattformen anzubieten. Während in der Wirtschaft 
u.a. staatlich geförderte Verbundprojekte Innovationen vorantreiben, wird mit diesen 
Instrumenten bislang relativ wenig in die öffentliche Verwaltung investiert. 
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Veränderung der Kundenbeziehung zwischen 
Verwaltungsmitarbeiter und Bürger 


Direkter Kontakt zur Bürgerin / zum Bürger 
Erhöhung der Effizienz der Abläufe durch 
digitale Assistenzsysteme 


Direkter Kontakt zur Bürgerin / zum Bürger. 
Erhöhung der Effizienz der Abläufe durch 
Reduzierung der Notwendigkeit für 
Behördengänge 


Stark reduzierter direkter Kontakt zur Bürgerin / 
zum Bürger, da im Regelfall die Kommunika- 
tion über digitale Plattformen abgewickelt 
wird. Die KI nutzt die dahinterliegenden 
Daten und optimiert die Abläufe 


Digitale Verwaltung ist Regelfall. Direkter Kontakt 

zu Bürgerinnen / Bürgern über Service-Hotline 
oder per Online-Kommunikation. Nur in begründeten 
Ausnahmefällen helfen Verwaltungsmitarbeiter, 
bestimmte Prozesse umzusetzen 


Bürgerinnen und Bürger interagieren nicht 
mehr pro-aktiv mit der öffentlichen Verwaltung. 
Vielmehr laufen die Verwaltungsschritte 
automatisiert ab. Bei Abweichungen von 
Regelmäßigkeiten wird direkter Kontakt zur 
Verwaltung aufgenommen um mögliche Fehler 
zu beheben 
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Notwendiger Implementierungsschritt 


Investitionsoffensive zur Implementierung 
Kl-basierter Systeme in der öffentlichen 
Verwaltung. Öffnung für die Zusammenarbeit 
mit externen (IKT-)Dienstleistern 


Weiterer Ausbau des digitalen Angebots der 
öffentlichen Verwaltung. Gezielte Nutzung 
von Apps und digitalen Plattformen zur 
Dienstleistungserbringung 


Nutzung der KI zur intelligenten Verknüpfung 
der Nutzerdaten, um die Verwaltungsabläufe 
noch effizienter zu gestalten 


Zusammenführung dezentral organisierter 
Nutzerdaten zur intelligenten Optimierung 
überregionaler Zusammenhänge 


Sehr frühe Verknüpfung individueller 
Handlungen mit verwaltungsrelevanten 
Prozessen zur Automatisierten und möglichst 
zeitnahen Dienstleistungserbringung 


In einem ersten Schritt gilt es daher, Defizite wie die fehlende digitale Infrastruktur, 
updatefähige vernetzte Systemkomponenten, mangelnde Kompetenzen etc. zu 
beheben und zeitnah Mittel für Forschungs- und Entwicklungsvorhaben für die 
öffentliche Verwaltung bereitzustellen. Denkbar hierfür sind Verbundprojekte, Ideen- 
wettbewerbe für KI-Start-ups sowie Pilotprojekte zu Anwendungen von KI-basierten 
Systemen in einschlägigen, verwaltungsrelevanten Prozessschritten. Ein weiterer 
Weg wäre, durch Pre-Commercial Public Procurement, die vorkommerzielle Auf- 
tragsvergabe, gezielt die Technologieentwicklung in der öffentlichen Verwaltung 
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anzukurbeln (EU 2007). Dabei fragt die öffentliche Hand über ein Wettbewerbsver- 
fahren Forschung und Entwicklungen an und identifiziert im Vergleich Best Practices. 
Ein Pre-Commercial Procurement lässt sich sehr gut mit dem föderalen Systemen in 
Deutschland in Einklang bringen, weil die Bundesländer und Kommunen FuE-Ent- 
wicklungen vorantreiben. 


Auf dieser Basis aufbauend muss es in einem zweiten Schritt darum gehen, immer 
mehr Prozesse auf digitale Plattformen zu übertragen. Vieles, was bisher mit aufwen- 
digen Behördengängen verknüpft ist, sollte zukünftig über digitale Verwaltungsplatt- 
formen zu erledigen sein. Im Endeffekt spart die öffentliche Verwaltung Kosten, und 
die öffentlichen Haushalte werden entlastet. Die damit verbundenen Möglichkeiten 
zeigen Best-practice Beispiele aus dem Ausland. 


Die intelligente Verknüpfung der Systeme und der Aufbau digitaler Plattformen 
schaffen die notwendige Datenbasis, damit Kl-basierte Produkte und Dienstleistun- 
gen auch im Bereich der öffentlichen Verwaltung Einzug erhalten. Künftig kann sie 
beispielsweise mit Hilfe KI proaktiv auf die Bürger zugehen und so dazu beitragen, 
Prozesse noch effizienter zu gestalten. Denkbar ist, dass Bürger ihre Daten künftig in 
einem Depot sammeln, auf das auch das Bürgeramt zugreifen kann. Im Falle der 
Erneuerung des Personalausweises könnte die KI so beispielsweise relevante Person- 
endaten abgreifen, alle notwendigen Schritte im Hintergrund vorbereiten, das Doku- 
ment automatisch erstellen und auf den Weg zum Bürger bringen. 


Regionale Nutzerdaten lassen sich miteinander verknüpfen, sodass sie überregional 
zur Verfügung stehen. Dies erleichtert die Mobilität von Bürgerinnen und Bürgern, z. 
B. wenn im Falle eines Umzugs in ein anderes (Bundes-)Land administrative Vorgänge 
automatisch über die Cloud aktiviert werden können. Um die Integration der Daten 
umzusetzen, ist bei der Verknüpfung auf Interoperabilität zu achten. 


Der Vergleich zum Kl-Einsatz im privatwirtschaftlichen Bereichen macht das hohe 
Transformationspotenzial augenfällig, das KI in der öffentlichen Verwaltung hat. 
Dienstleistungen für den Bürger und die Interaktion zwischen Behörden auf der 
einen und Bürgern auf der anderen Seite können mit dem Einsatz von digitalen Tech- 
nologien bereits heute und in Zukunft sukzessive mit Kl effizienter und damit für alle 
Beteiligten zeitsparender und kostengünstiger erbracht werden. 
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7. Learning Analytics an Hochschulen 


Corinne Büching, Dana-Kristin Mah, Stephan Otto, Prisca Paulicke, 
Ernst A. Hartman 


Digitale Angebote sind inzwischen fester Bestandteil des Bildungssystems. 
Zahlreiche Hochschulen verwenden Learning-Management-Systems (LMS) zur 
Unterstützung von Lehre und Studium und bieten immer häufiger Online- 
Kurse an, z. B. Massive Open Online Courses (MOOC) (Cormier und Siemens 
2010). Bei der Nutzung digitaler Lernangebote und Lernumgebungen fallen 
kontinuierlich Daten an, die sich analysieren lassen, Einblick etwa in das indi- 
viduelle Lernverhalten geben oder Hinweise darauf, wie die Lehre und das 
Lernen unterstützt werden könnten, um Lernprozesse zu verbessern. Bislang 
nutzen Bildungsinstitutionen diese Daten jedoch noch wenig - mittels Lear- 
ning Analytics könnte sich das ändern. Was aber ist Learning Analytics? Und 
wie ist es im Kontext Kl einzuordnen? 


Learning Analytics verwendet dynamisch generierte Daten von Lernenden, Lehren- 
den und Lernumgebungen, mit dem Ziel, Lernprozesse und Lernumgebungen zu 
optimieren (Ifenthaler 2015). Die hierzu verwendeten Daten setzen sich aus leis- 
tungs- und personenbezogenen sowie curricularen Variablen - z. B. aktuelle Studien- 
leistungen, Aktivität in universitären Onlinesystemen, soziodemografische Daten - 
zusammen, die u. a. aus dem LMS stammen. Anhand solcher Daten können Lernver- 
halten analysiert und Lernprofile erzeugt werden. Im Hochschulkontext werden in 
der Regel Algorithmen verwendet, die aufgrund von Echtzeitdaten berechnen kön- 
nen, wie groß etwa die Wahrscheinlichkeit der erfolgreichen Absolvierung eines Kur- 
ses ist, um Risikostudierende zu identifizieren (Arnold 2010). Zudem können die Ler- 
nenden automatisch generiertes personalisiertes Feedback zu ihrem Lernprozess 
sowie individualisierte Empfehlungen zur Unterstützung erhalten (Pistilli und Arnold 
2010). 


Die individuell angepassten Rückmeldungen, Lernempfehlungen sowie die Vorhersa- 
gen zum Lernerfolg (wie die Berechnung von Erfolgswahrscheinlichkeiten durch 
Learning Analytics ist Gegenstand der Debatte im Kontext von Kl, ML, intelligenten 
Tutorensystemen und adaptivem Lernen (Adams Becker et al. 2017). Adaptives Ler- 
nen und Learning Analytics beschrieb bereits 2016 der NMC Horizon Report (Hoch- 
schulausgabe), der Technologietrends und Auswirkungen neuer Technologien im 
Hochschulbereich weltweit erfasst und als Lehr-/Lerntechnologien identifiziert, die 
innerhalb eines Jahres oder schneller weite Verbreitung finden werden (Johnson et 
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al. 2016). Adaptive Lerntechnologien können sich durch große Datenmengen und 
intelligente Algorithmen immer besser dynamisch und in Echtzeit auf Personen ein- 
stellen sowie passende Lernaktivitäten und -inhalte antizipieren (Johnson et al. 2016). 
Beispielsweise verwendet die Sprachlern-App „Duolingo” virtuelle Chatpartner 
(Chatbots), die automatisiert und adaptiv auf die Lernfortschritte der Lernenden 
reagieren können. Auch erste Textbewertungs-Programme für schriftliche Arbeiten, 
insbesondere in Rahmen von MOOCSs, werden entwickelt und erprobt, die auf KI- 
Grundlage den Bewertungsstil der Prüfenden lernen und Texte dementsprechend 
beurteilen können. Eine vollständige Automatisierung von intelligenten Systemen 
und Learning Analytics ist jedoch stark umstritten, da bisher menschliche Urteilskraft 
bei der Leistungsbewertung unabdingbar ist. So zeigt Learning Analytics aggregierte 
Daten und deren Visualisierung - die Interpretation der Daten sowie die datenevi- 
denten Interventionen sollten anhand lerntheoretischer und pädagogischer Kompe- 
tenz durch Lehrende erfolgen. 


Aktuell erforschen und nutzen vorrangig englischsprachige Länder wie USA, Austra- 
lien und das Vereinigte Königreich Learning Analytics. In Deutschland wird es bisher 
kaum thematisiert und angewendet. Dabei können internationale Studien bereits 
einen positiven Zusammenhang zwischen dem Einsatz von Learning Analytics und 
Studienerfolgen aufzeigen (Sclater und Mullan 2017). 


Nutzen und Spektrum von Learning Analytics 


Learning Analytics bietet den an Lernprozessen beteiligten Gruppen wie Politik, Institu- 
tionen, Instruktionsdesign, Lernende und Lehrende vielfältigen Nutzen (Ifenthaler und 
Widanapathirana 2014). Beispielweise ermöglicht es auf politischer Ebene institutions- 
übergreifende Vergleiche und kann als Informationsquelle für Qualitätssicherungspro- 
zesse dienen. Lernende erhalten Einblick in ihre Lerngewohnheiten, können diese 
reflektieren und optimieren und somit ihre Erfolgschancen erhöhen. Lehrende können 
ihre Lehrpraktiken analysieren und ihre Lehrqualität verbessern sowie Risikostudierende 
identifizieren und entsprechend eingreifen (Ifenthaler und Schumacher 2016). 


Allgemein geht mit Learning Analytics die Verheißung einher, dass die Analyse der 
aggregierten Daten und das daraus generierte Feedback an Lehrende wie Lernende 
die Qualität der Lehr- und Lernprozesse deutlich verbessern kann. Lehrende fragen 
sich häufig: Welche Wirkung hat meine Lehrveranstaltung erzielt? Konnte ich alle 
Bedürfnisse der Studierenden einbeziehen? Zumeist wurden und werden diese Fra- 
gen durch die Klausurnoten von Studierenden oder durch Lehrevaluationen am Ende 
des Semesters beantwortet. 


Einhergehend mit der technischen Entwicklung hin zu Online- und Blendend Lear- 
ning-Formaten an den Universitäten sind Studierende hochschulintern mehr und 
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mehr online und setzen ihre digitalen Fußabdrücke. Zumeist äußerst sich dies in Form 
von Online Communities, Foren, Blogs, oder schlicht über eine Lernplattform wie 
z. B. Moodle der jeweiligen Lehrveranstaltung (Sin und Muthu 2015). Wenn sich 
Studierende in einem LMS wie Moodle bewegen, eröffnen sich für die Lehrenden 
neue Möglichkeiten, die digitalen Lerndaten von Studierenden bereits im Lernpro- 
zess, also im laufenden Semester, zu verfolgen. Plötzlich sind Daten verfügbar, die 
den Lehrenden etwa darüber Auskunft geben, wer in welchem Umfang das Lernset- 
ting nutzt, wie etwa Logins, Forenbeiträge. In diesem Zusammenhang spricht man in 
der anglo-amerikanischen Literatur von dem Wissen über „learning experience in 
learning environments” (Merceron, Bilkstein und Siemens 2015). 


Aus der Sicht eines Lehrenden liegt darin der Vorteil, schon während des Semesters 
beobachten zu können, welche Lernmedien online besonders gut angenommen 
werden (z. B. Lehrvideos, Podcasts, Texte), bei welchen Onlinetests die Studierenden 
vielleicht größere Schwierigkeiten haben oder auch schlicht zu welchen Tages- oder 
Wochenzeiten sie sich an die Arbeit setzen. Abbildung 7.1 zeigt beispielhaft ein 
Dashboard, das Lehrenden die Aktivitäten ihrer Studierenden tagtäglich übersichtlich 
anzeigt und ihnen die Möglichkeit gibt, unmittelbar zu intervenieren, wenn z. B. 
Studierende unterdurchschnittlich gut mitarbeiten - sei es, dass subjektiv Verständ- 
nisschwierigkeiten bestehen, das Lehrmaterial mangelhaft ist oder die Lehrenden 
etwa den Stoff nicht gut aufbereitet haben. 


Anhand des so visualisierten Lernverhaltens der einzelnen Studierenden könnte der 
Lehrende individuelle Lernwege effektiver erkennen oder unmittelbar Maßnahmen 


All Students Activity Report 


Click the header to sort 
Name Total Views Sessions Online Time Viewed Resources Initial Threads Total Posts 

Average m 357.69 m 60.28 m 7:15:36 n 36.54 
m 565 m 39 u 15:71:04 A 47 
m 293 um 49 m 9:04:52 — 35 
m 504 m 71 12:54:14 — 39 
m 390 m 64 11:59:50 — 4 
m 269 m 52 mm 5:36:38 — 27 1 1 
m 290 m 47 n 10:24:45 m 32 
=m 260 m 41 mm 1:42:18 nn 33 


C 776 (EEE 103 13:34:17 [1 


un 372 m 73 um 5:57:26 — 9 


Abbildung 7.1: Ansicht eines Dashboards zu den Aktivitäten von Studierenden (Quelle: 
Zhang und Almeroth 2010). 
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für eine Nachjustierung der Methodik und Didaktik der Lehrveranstaltung treffen. 
Aus dem skizzierten Bild ergeben sich allerdings Fragen zum Lernen: Welche Erkennt- 
nisse sind durch Learning Analytics im Hinblick auf das Lernverhalten zu erwarten? 
Ist Learning Analytics die Voraussetzung für adaptives Lernen? Wie können das Lern- 
verhalten oder der individuelle Lernprozess optimiert werden, z. B. durch Verfolgen 
des Clickstreams bei MOOCSs? Liegen Lernschwächen oder besondere Begabungen 
vor? 


Die Daten aus den Lehrveranstaltungen könnten um weitere Studierendendaten 
ergänzt werden, um sie unter dem Aspekt „Studienerfolg” zu analysieren. Kellen 
(Kellen et al. 2013) untersuchten die Daten von Studierenden im Zeitverlauf von 
mehreren Semestern. Sie nutzten Hintergrunddaten (z. B. die Abiturnote) der Studie- 
renden und Daten aus den Lehrveranstaltungen. Sie fügten diese Teilmengen 
anschließend zu einem Gesamtscore zusammen und konnten erkennen, welche Stu- 
dierenden positiv auffallen, und sie von denen unterscheiden, die im Mittel hinter 
ihren Kommilitonen zurückblieben. Zum Einsatz von Learning Analytics als Werkzeug 
zur Qualitätssicherung und Qualitätsentwicklung ergeben sich folgende Fragen: 
Kann durch Learning Analytics der Unterricht verbessert werden? Können durch 
Learning Analytics Risikostudierende identifiziert werden? Ist Learning Analytics also 
ein geeignetes Instrument zur Vermeidung von Studienabbrüchen? Eignen sich die 
Daten für Prognosen bzw. kann man aus ihnen künftigen Lernerfolg ableiten? 


Auf einer Ebene oberhalb von Lehrveranstaltungen und Studiengängen können 
Datenanalysen über ganze Bildungsinstitutionen hinweg Aussagen zu deren Effekti- 
vität und deren Beitrag zum Studierendenerfolg machen. Allgemein bekannt sind 
hier die PISA-Studien (Programme for International Student Assessment). 


Zusammenfassend kann festgehalten werden, dass unterschiedliche Gruppen von 
Beteiligten (z. B. Studierende, Dozierende, Hochschulleitungen oder auch Regie- 
rungsinstitutionen) unterschiedliche Interesse an Daten haben können, die etwas 
über den Studierendenerfolg auf Mikroebene einer Lehrveranstaltung, auf Meso- 
ebene der Studiengänge oder Makroebene der Hochschulen aussagen (siehe Abbil- 
dung 7.2). 


Mögliche Ziele von Learning Analytics sind nachfolgend in Anlehnung an Leitner und 
Ebner (2017) aufgelistet: 


e Identifizierung und Unterstützung von Risikostudierenden 
e Verbesserung von Retention und Leistung 
e Visualisierung der Lernleistung anhand einer Vergleichsgruppe 


e (Echtzeit-)Feedback zu Lernperformance und -aktivität 
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Verbesserung der Gruppenarbeit durch Aufzeigen der Mitwirkung der einzelnen 
Gruppenmitglieder 


Visualisierung zum Engagement und Niveau in Diskussionsforen 
Förderung der Reflexion und Selbsteinschätzung im Lernprozess 
Aussagen zur Interaktion in einem E-Learning-System 


Evaluation von Lehr- und Lernprozessen 


Ziele von Learning Analytics, Qualitäts- und Evaluationskriterien sowie Chancen und 
Herausforderungen sind in einer Vielzahl von Frameworks formuliert, die als Richtli- 
nien für die erfolgreiche Entwicklung, Implementierung und Anwendung von Lear- 
ning Analytics fungieren sollen (Greller und Drachsler 2012; Scheffel et al. 2015). So 
ist die Erhöhung des Studienerfolgs ein zentrales Ziel von Learning Analytics und im 
Erfolgsfall auch deshalb interessant, weil so im Umkehrschluss hohe Studienabbruch- 


INSTITUTIONELLE ANALYTIK 


z.B. Abschlussquoten, Immatrikulations- 
daten, sozio-Okonomische Daten etc. 


AKADEMISCHE ANALYTIK 


z.B. Notendurchschnitt, Spezialisie- 
rungen, vorherige Kurse, erreichte 


Punktzahl im standardisierten 
Aufnahmetest (Scholastic 
Assessment Test, SAT etc.) 


LERNANALYTIK 


z.B. Daten zur individuellen 
Studierendenbeteiligung, 
Quiz-Ergebnisse, Häufigkeit der 
Videoaufrufe 


Abbildung 7.2: Dimensionen der Analyse von studentischem Erfolg (Quelle: Elias 2011, 
eigene Darstellung und Übersetzung). 
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quoten vermeidbar werden (Mah et al. 2016). Deutschland strebt die Erhöhung von 
Studienerfolg an, um beispielsweise dem Fachkräftemangel zu begegnen (BMBF 
2012). Den Studienerfolg vorherzusagen und Risikostudierende zu identifizieren ist 
auf Basis von leistungs-, personenbezogenen und curricularen Variablen möglich 
(Arnold und Pistilli 2012). Studierende erhalten personalisiertes Feedback zu ihrem 
Lernprozess auf Kursebene sowie Empfehlungen für Unterstützungsangebote (Pistilli 
und Arnold 2010). Diese Informationen werden den Nutzern nahezu in Echtzeit im 
Dashboard zur Verfügung gestellt, beispielsweise visualisiert als Ampel oder Kompass 
(Verbert, Duval, Klerkx, Govaerts und Santos 2013). 


Tools und Techniken 


Immer dann, wenn Studierendendaten einem kontinuierlichen Tracking bzw. einem 
systematischen Assessment unterzogen werden sollen, kommen zumeist Content- 
oder Learning-Management-Systeme (CMS/LMS) zum Einsatz. Diese sind nach Hijon 
und Carlos (2016) von einer umfassenden und zufriedenstellenden Funktionalität 


Overall Summary of User Activity 


Area ID 
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Blackboard Scholar 

C-Labs BB 

Calendar 
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Email 
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DORA Powered by Blackboard Leam™ 6/2/2016 


Abbildung 7.3: Ansicht eines Kursberichts über die Aktivitäten der Studierenden (Quelle: 
Florida State University 2018). 
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noch weit entfernt. Auf der Ebene einer Lehrveranstaltung werden unter der Über- 
schrift Learning Analytics vor allem Häufigkeiten der Aktivitäten von Studierenden 
erhoben, z. B. Interaktion zwischen ihnen und angebotenem Lernmaterial oder unter 
Kommilitonen. Ein mögliches Interface könnte in Anlehnung an Abbildung 7.3 
gestaltet sein. 


Je nach Fragestellung können jedoch auch Netzwerkanalysen, die den Prozess der 
Interaktion von Studierenden aufzeigen, in einem Netzdiagramm visualisiert werden 
(siehe Abbildung 7.4). 


Wenn Einflüsse zwischen Noten, Modulen und Studiengängen untersucht werden 
sollen, spielen neben den genutzten LMS (z. B. Moodle, ILIAS) auch die CMS der 
Hochschulen, insbesondere diejenigen, die das Prüfungsamt nutzt, eine zentrale 
Rolle. Wenn bedeutende Variablen von Studierendengruppen (z. B. Geschlecht, 
Abschluss, Migrationsgeschichte) sowie einzelner Studierender zusammengeführt 
und analysiert werden könnten, ließen sich einige interessante Fragen beantworten. 
Hochschulen könnten auf diese Weise u. a. ihre Zulassungsverfahren überprüfen, 
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Abbildung 7.4: Visualisierung einer Analyse sozialer Netzwerke (Quelle: Panke 2010). 
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etwa: Lassen wir die richtigen Studierenden in einem bestimmten Studiengang zu? 
Was braucht ein Studieninteressierter, um das Studium der Wirtschaftswissenschaft 
in unserer Institution erfolgreich zu absolvieren? Welche Teilgruppen profitieren 
besonders von welcher Art von Unterstützung? 


Das Zusammenführen einzelner Variablen kann für die Beantwortung solcher Fragen 
neue Möglichkeiten bieten. Kritiker geben vor dem Hintergrund aktueller Daten- 
schutzdebatten zu bedenken, dass die Freigabe von persönlichen Daten für den eige- 
nen Lernprozess (z. B. Feedback vom Dozierenden) oder für einen höheren Zweck 
(z. B. um nachfolgenden Studierenden effektive Lernsettings zu bieten) kontrovers 
diskutiert wird. 


Praxisbeispiele im Hochschulkontext 


Während im angloamerikanischen Raum bereits eine Vielzahl von entsprechenden 
Programmen an den Universitäten implementiert ist -— und deren Wirksamkeit 
erforscht wurde - steckt die Anwendung von Learning Analytics im deutschsprachi- 
gen Hochschulbereich noch in den Kinderschuhen (Sclater, Peasgood, Mullan 2016). 
Allerdings gibt es hierzulande zunehmend Bestrebungen, innovative Szenarien auf 
Grundlage von Learning Analytics zu identifizieren und deren Potenziale für die deut- 
sche Hochschullandschaft nutzbar zu machen (Ifenthaler, Mah und Yau 2017). Der 
konkrete Einsatz von Learning Analytics für spezifische Zielsetzungen lässt sich exem- 
plarisch an drei Projekten aufzeigen: 


Early Alert an der University of New England, Australien 


Die University of New England, New South Wales in Australien, hat mehr als 18.000 
Studierende, von denen viele das Studium in Teilzeit absolvieren und als Nicht-traditio- 
nelle Studierende gelten. Vor dem Einsatz von Early Alert lag die Studienabbruchs- 
quote bei etwa 18 Prozent, was die Hochschule nicht länger hinnehmen wollte (Scla- 
ter, Peasgood, Mullan 2016, S. 33). Aus diesem Grund richtete sie Early Alert als mehr- 
schichtiges Learning-Analytics-System mit dem Ziel ein, das Befinden der Studierenden 
und deren individuelle Lehr-Lern-Bedürfnisse zu ermitteln. Neben einem Abfrageportal 
(e-Motion), in dem Studierende online ihre aktuelle Befindlichkeit über Emoticons mel- 
den können, haben sie im Early-Alert-System zusätzlich die Möglichkeit, textbasierte 
Rückmeldungen über The Vibe zu geben und zugleich auch die ihrer Kommilitonen 
einzusehen. Alle Studierendendaten werden in der Automated Wellness Engine (AWE) 
zusammengeführt, in der diese zusätzlich um Daten zu „class attendance, previous 
study history, prior results, assignment submissions, and access patterns for the stu- 
dent online portal and other university websites” (Sclater, Peasgoog, Mullan 2016, S. 
33) ergänzt werden. Klassifiziert nun das System die Entwicklung eines Studierenden 
als problematisch, wird dieser zunächst per E-Mail angesprochen und angefragt, ob 
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Unterstützung benötigt wird. Hilfestellungen werden dann - je nach Notwendigkeit 
- um Telefon- oder persönliche Beratung ergänzt. Das Early-Alert-System konnte dazu 
beitragen, dass nur noch 12 Prozent ihr Studium abbrachen. 


MentOR an der Universität Duisburg-Essen 


Das Programm MentOR (Mentoring im Orientierungspraktikum mit online-gestützter 
Rückmeldung) ist ein Projekt an der Fakultät für Bildungswissenschaften, das sich 
explizit an Lehramtsstudierende in der Studieneingangsphase richtet und ihnen auf 
der Basis unterschiedlicher Fremd- und Selbsteinschätzungen eine Rückmeldung zur 
Kompetenzentwicklung und zur Eignung für den Lehrerberuf bietet (Niemann et al. 
2014). Rund um das erste Schulpraktikum im Bachelor-Lehramtsstudium geben die 
Studierenden eine Selbsteinschätzung zu ihren Kompetenzen vor und nach dem 
Praktikum ab, die um die Fremdeinschätzungen der Lehrkräfte im Praktikum und der 
Dozierenden des universitären Begleitseminars auf einer Online-Plattform ergänzt 
werden. 


Die so generierten individuellen Daten von den Studierenden werden diesen dann in 
individuellen Kompetenzprofilen zur Verfügung gestellt. Im Rahmen von Rückmelde- 
gesprächen mit dem Dozierenden des Begleitseminars ermittelt dieser gegebenen- 
falls daraus abgeleitete Optionen für eine Beratung (Niemann et al. 2014). 


Die Learning Analytics-Strategie an der Open University im Vereinigten Königreich 


Die Open University ist die größte staatliche Universität in Großbritannien und Europa 
und basiert als Fernuniversität auf dem Supported Distant Learning System, welches 
einen ortsunabhängigen Zugriff auf sämtliche Studieninhalte ermöglichen soll. 


Schon diese Struktur der Universität lässt auf einen möglichen Bedarf an Feedbackfor- 
maten auf Basis von Learning Analytics schließen, um Lehr- und Lernsettings effektiv 
zu gestalten. Anders als viele Hochschulen, die Learning Analytics im Rahmen eines 
Projekts mit einem spezifischen Fokus (Zielgruppe, Fakultät) nutzen, ist Learning Ana- 
lytics an der Open University in eine umfassende Gesamtstrategie eingebunden, die 
eine Vielzahl von Projekten mit fachspezifischem und fachübergreifendem Fokus 
beinhaltet. So wird u. a. das wöchentliche Arbeitspensum der Studierenden an der 
Open University erfasst. Weiterhin erhebt eine Längsschnittstudie online an drei Uni- 
versitäten die Kompetenzentwicklung der Studierenden, um hieraus Bedingungen für 
das Gelingen von Lehre und Lernen abzuleiten. Wie viel Peer-Unterstützung Studie- 
rende brauchen, wird mit qualitativen Verfahren (social network analysis, Lerntagebü- 
cher, Fokusgruppeninterviews) ermittelt. Die Forschungsergebnisse auf Grundlage der 
über Learning Analytics erhobenen Daten verweisen darauf, welches Feedback Stu- 
dierende bevorzugen (Nguyen et al. 2016), oder auf die möglichst lerneffektive Bereit- 
stellung von Selbstlernmaterial (Toetenel und Rienties 2016). 
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Herausforderungen und Risiken 


Den vielfältigen Chancen von Learning Analytics stehen Herausforderungen und Risi- 
ken gegenüber wie Datenqualität, Datenschutz und Privatsphäre sowie Akzeptanz 
der Nutzergruppen (Pardo et al. 2014; Slade und Prinsloo 2013). Zunächst gibt es 
grundsätzlich die Schwierigkeit, die anfallende Menge an unstrukturierten Daten 
und Metadaten zu organisieren. Educational Data Mining ist eine Möglichkeit, die 
Daten für weitere Analysen zugänglich zu machen. Learning Analytics hat wiederum 
die Aufgabe, die Daten zu analysieren und zu visualisieren. Die Datenqualität ist aber 
unterschiedlich und die Warnung vor wissenschaftlich nicht begründeten Schlussfol- 
gerungen über Lehr- und Lernprozesse wird laut. Zudem besteht die Gefahr, dass 
Wissen über Lehr- und Lernprozesse aufgrund von statistischen Wahrscheinlichkeiten 
gewonnen wird, Learning Analytics die Daten jedoch nicht interpretiert und somit 
wissenschaftlich unvollständig begründete Zusammenhänge hergestellt werden 
(Loser 2016). Learning Analytics fragt beispielsweise nicht nach den Gründen für 
schlechte Antworten, sondern zeigt statistisch auf, dass eine Lernschwäche bei 
bestimmten Antwortmustern vorhanden ist. Das sollte der Wissenschaft nicht genü- 
gen, so Loser (2016). Die Interpretation der Daten erfolgt durch menschliche Beurtei- 
lung. Diese kann sich mittels Learning Analytics auf eine Vielzahl von Daten stützen 
und daraus datenevidente Interventionen ableiten. Es handelt sich um eine sinnvolle 
Zusammenarbeit von Mensch und Maschine, um Lehr-/Lernprozesse und Lernumge- 
bungen zu optimieren. 


Aus der Perspektive der Studierenden wird häufig in populärwissenschaftlichen 
Debatten vor dem „gläsernen Studierenden” gewarnt. Tatsächlich konnte man noch 
nicht abschließend und zufriedenstellend klären, wie die Studierenden-Daten ano- 
nym bleiben können. Zudem ist fraglich, ob Studierende einen derart umfassenden 
Überblick über ihre Daten haben, um eine bewusste Entscheidung über Teilnahme 
und Datenfreigabe für die Analyse treffen zu können. Damit einhergehend ist Freiwil- 
ligkeit ein Thema, da für manche Angebote ein Zwang zur Nutzung (z. B. von E-Lear- 
ning-Plattformen) besteht. Eine weitere Gefahr für Lernende besteht in einer mögli- 
cherweise entstehenden „Filter-Blase”: Die Prognose von Verhaltenswahrscheinlich- 
keiten und personalisierte Empfehlungen begrenzen die Entwicklungsmöglichkeiten 
mit den Konsequenzen, dass die Kreativität unterdrückt werde sowie falsche Pfade 
und Scheitern, die auch Quelle des Lernens darstellen können, unwahrscheinlicher 
werden (Loser 2016). Denkbar sei in diesem Zusammenhang, dass wirtschaftliche 
und politische Interessen die Vorschläge beeinflussen, die das jeweilige System 
macht. 


Die Gefahren für die Lehrenden an Hochschulen können aus zwei Perspektiven 
betrachtet werden. Erstens aus der Sicht auf die Kompetenz der Lehrenden selbst 
und zweitens aus der Perspektive der Lehrenden auf die Studierenden und deren 
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Bewertung. Betrachtet man die Kompetenz der Lehrenden, lässt sich derzeit festhal- 
ten, dass diese hinsichtlich der Möglichkeiten und Tools, die Learning Analytics bie- 
tet, besser qualifiziert sein sollten. Anders formuliert: Um Learning Analytics und KI 
zielführend und gewinnbringend für Hochschullehrende einzusetzen, müssen Quali- 
fikationsformate erarbeitet und angeboten werden. Was die Beziehungen von Leh- 
renden zu Studierenden betrifft, bestehen die Gefahren der Kontrolle, der Stereoty- 
pisierung sowie der Leistungsbewertung durch nicht-menschliche Akteure. 


Für die deutschen Hochschulen lässt sich bei einer Etablierung von Learning Analytics 
eine Herausforderung formulieren: Es handelt sich um die „adäquate Interpretation 
der Daten, da Learning Analytics zwar mit dem Engagement und der Beteiligung von 
Studierenden korreliert, aber noch keine Aussage darüber trifft, was Lehrende verän- 
dern sollten” (Ionica 2016). Damit wird angesprochen, dass sehr viele Daten ange- 
häuft, weniger analysiert und noch weniger in die Praxis als konkrete Umsetzung 
rückgekoppelt werden. Was passiert mit den Daten, zu welchem Zweck werden sie 
gesammelt und unter welchen Gesichtspunkten werden sie analysiert? Das sind 
einige der Fragen, denen sich die Hochschulen stellen müssen. Vor dem Hintergrund, 
dass der Markt von Learning-Analytics-Tools stark fragmentiert ist und derzeit drin- 
gend Normen notwendig sind (Leitner et al. 2017, 380ff.), werden Standards und 
Datenaustauschformate immer wichtiger, die einen sicheren Transfer sensibler Daten 
gewährleisten. Konkret: Die Hochschulen müssen das Datenmanagement klären und 
einer Überwachungskultur entgegentreten. 


Der Umgang mit Bildungsdaten ist bislang weitestgehend nicht reguliert, IT-Sicher- 
heitsstandards fehlen. Datenschutzbeauftragte warnen vor den Gefahren von Big 
Data. Wirtschaftliche, pädagogische und ethische Bedenken über Konsequenzen 
werden laut, und es wird formuliert, dass gegenwärtig kaum abzuschätzen sei, wel- 
che Risiken mit Learning Analytics und KI im Hochschulbereich einhergehen (Jülicher 
2015, 5. 3). 


Es bleibt festzuhalten, dass die Interpretation von Daten mit Learning Analytics im 
Hochschulbereich vor Herausforderungen steht, „die noch viel Forschung, Beratung 
und eine Qualifizierung für Studierende und Hochschullehrende voraussetzt. Vor 
allem muss das Vertrauen aller Beteiligten in die Transparenz und Sicherheit der 
Daten und der Prozesse hergestellt werden, auch wenn die dafür notwendigen Tech- 
nologien insbesondere für die Datensicherheit längst vorhanden sind” (lonica 2016). 


Zukunftsperspektiven zum Einsatz von Learning Analytics mit KI-Bezug 


Nach der Darstellung von Learning Analytics im Hochschulkontext hinsichtlich Nut- 
zen, Tools und Techniken, Praxisbeispielen sowie Herausforderungen, sollen anknüp- 
fend an aktuelle Projekte und Entwicklungen, nachfolgend drei Zukunftsperspekti- 
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ven zum Einsatz von Learning Analytics mit Kl-Bezug skizziert werden: (1) Personali- 
siertes Lernen, (2) automatisiertes Feedback und Beratung sowie (3) humanoide 
Roboter als Assistenten in der Hochschullehre. 


1. Personalisiertes Lernen. Schon jetzt liegen zahlreiche elektronische Lernendenda- 
ten vor, die durch das verstärkte online Lernen und online Lehren sowie durch die 
Digitalisierung von Lehr- und Lernumgebungen (z. B. MOOCSs, LMS) noch zunehmen 
werden. Mit Learning Analytics werden diese Daten verarbeitet, analysiert und visu- 
alisiert, um Lehrende eine datengestützte Grundlage zur Einschätzung von Lernen- 
den und Ableitung von Unterstützungsmaßnahmen zu bieten. Zudem ermöglicht 
Learning Analytics Einblicke in Lernverhalten und Lernfortschritte, wodurch Lern- 
und Lehrumgebungen optimiert und Lernen personalisiert werden könnte. 


Die Personalisierung von Lerninhalten ist Ziel des Projekts „HyperMind - Das antizi- 
pierende Physikschulbuch”“® der Technischen Universität Kaiserslautern in Zusam- 
menarbeit mit dem Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI), 
gefördert vom Bundesministerium für Bildung und Forschung. Entwickelt werden soll 
ein intelligentes Physikschulbuch, das adaptiv-dynamisch Inhalte und Aktivitäten ent- 
sprechend der individuellen Kompetenzen und Bedürfnisse der Lernenden zur Verfü- 
gung stellt. Grundlage für die Aktivitätserkennung ist ein Eye-Tracker, der unter dem 
Display des Schulbuchs (Tablet oder Computerbildschirm) angebracht ist und die 
Blickposition der Lernenden erfasst. Somit wird die Verweildauer des Blicks auf den 
unterschiedlichen Abschnitten - z. B. Einleitung, Definitionen, Anwendungsbeispiele 
- während der verschiedenen Testphasen - z. B. Textlesen, Aufgabenlösen -— gemes- 
sen. Diese Daten werden mit Kl-Algorithmen analysiert, um Unter- und Überforde- 
rung, Lernverhalten und -fortschritte sowie Präferenzen und Lernniveaus vom 
Anfänger über Fortgeschrittene bis zu Expertinnen und Experten zu untersuchen. 


Zukünftig vorstellbar wäre eine verstärkte Verknüpfung von Learning Analytics mit 
diversen Sensordaten wie Eye-Tracking für Blickposition oder Smartwatches für Puls- 
messung, um vertiefte Einblicke in Lernendenverhalten zu erhalten, automatisiert 
adaptiv-dynamische Lerninhalte zu generieren und somit personalisiertes Lernen zu 
ermöglichen. Perspektivisch wäre dieses Szenario zur automatisierten Unterstützung 
personalisierten Lernens in verschiedenen Bildungskontexten - z. B. Schule, Hoch- 
schule und Weiterbildung - denkbar. 


2. Automatisiertes Feedback und Beratung. Persönliches Feedback zum Lernprozess 
ist für Lernende sehr wichtig - im Hochschulkontext insbesondere im ersten Studien- 
jahr, der sogenannten Studieneingangsphase, in dem die meisten Studienabbrüche 


@  httos://www.physik.uni-kl.de/en/kuhn/forschungsprojekte/aktuelle-projekte/uedu/ 
hypermind/, zuletzt geprüft am 22.06.2018 
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stattfinden (Heublein et al., 2017). Bei der großen Anzahl Studierender ist ein indivi- 
duelles Feedback durch einen Lehrenden aus Kapazitätsgründen schwer realisierbar 
- genau hier könnte eine KI eingesetzt werden. Wie einleitend beschrieben, ist ein 
Ziel von Learning Analytics das Feedback zu Lernperformance und -aktivität in Echt- 
zeit. Das Course-Signals-System der Purdue University (USA) zeigt Studierenden und 
Lernenden Erfolgswahrscheinlichkeiten auf Kursebene anhand eines Ampelsystems 
an - grün: hohe Erfolgswahrscheinlichkeit, gelb: mittlere Erfolgs-/Misserfolgswahr- 
scheinlichkeit, rot: hohe Misserfolgswahrscheinlichkeit (Pistilli und Arnold 2010). 
Feedback in Echtzeit mittels Learning Analytics gewinnt an Bedeutung, da das Ange- 
bot an Online-Kursen zunimmt, wenngleich Abbruchraten bei Online-Kursen beson- 
ders hoch sind. Auch in Online-Kursen sollten Lernende möglichst frühzeitig und 
regelmäßig Feedback zu ihren Lernfortschritten erhalten. In diesem Rahmen sind 
Beratungsangebote, wie beispielsweise allgemeine Studienberatung, Studienorien- 
tierung und Mentoring wichtige Aspekte eines Studiums. 


Die Kiron Open Higher Education gmbH“? bietet seit 2015 ein Online-Studienpro- 
gramm für Geflüchtete an, um gleitende Zugänge zur Hochschulbildung zu ermög- 
lichen. In Kooperation mit derzeit 56 Partnerhochschulen bietet Kiron ein „Blended 
Learning 2.0”-Bildungsmodell an. Bis zu zwei Jahre kann ein Onlinestudium von den 
geflüchteten Personen absolviert werden, daran anschließend erfolgt an einer Part- 
nerhochschule zwei Jahre lang ein Präsenzstudium. Derzeit sind mehr als 3.300 Stu- 
dierende auf der Kiron-Plattform registriert. Neben den fünf Fachbereichen (Business 
and Economics, Mechanical Engineering, Computer Science, Political Science und 
Social Work) werden Beratungs- und Unterstützungsangebote im Rahmen eines 
Beratungsnetzwerks offeriert. Um die Maßnahmen in der Orientierungsphase mög- 
lichst effizient zu gestalten, werden digitale Beratungsangebote eingesetzt, wie ein 
Self-Assessement-Tool zur Entscheidungsfindung, ein Onboarding-MOOC für zuge- 
lassene Studierende zur Information über erste Schritte auf der Kiron-Lernplattform 
und Live-Online-Sessions. Perspektivisch sollen durch vermehrte Automatisierung 
noch mehr Menschen mit digitalen Angeboten erreicht werden. 


Zukünftig denkbar wären hier automatisierte personalisierte Beratungsangebote auf 
Basis von aufbereiteten Lernendendaten mittels Learning Analytics. Hierbei wäre es 
vorstellbar, dass Kl-Algorithmen aus den existierenden Daten lernen, Muster zu 
erkennen und Beratungsbedarfe klassifizieren. Eine Automatisierung von Betreu- 
ungs- und Beratungsprozessen mittels KI-Einsatz, beispielsweise bei Standardfragen, 
würde mehr Freiraum für individuelle Gespräche und Beratung durch Dozierende 
und Beratungspersonal ermöglichen. 


2 httos://kiron.ngo/wp-content/uploads/2017/02/2017-09-25_INTEGRAL%C2%B2_ 
Broschu%CC%88re_Abschlussveranstaltung.pdf, zuletzt geprüft am 13.07.2018 
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3. Humanoide Roboter als Assistenten in der Hochschullehre. Die Digitalisierung der 
Hochschulbildung erfordert neue digitale Lehr- und Lernszenarien. Die Methode 
„Inverted Classroom” (auch „Flipped classroom” genannt) bezeichnet die Methode 
des umgedrehten Unterrichts. Lehrinhalte werden digital in Form von MOOCSs, Lernvi- 
deos, Lernmaterialien und Tests auf Onlineplattformen zur Verfügung gestellt und 
ortsunabhängig eigenständig zur Vorbereitung auf die Präsenzveranstaltung erarbei- 
tet. Die Präsenzveranstaltung wird für Vertiefungen, gemeinsames üben, diskutieren 
und kollaboratives Arbeiten genutzt. Kollabroatives Arbeiten ist jedoch betreuungsin- 
tensiv - und mit wenig Lehrenden und vielen Studierenden eine Herausforderung. Wie 
könnten hier humanoide Roboter (charakterisiert durch menschliche Form und 
menschliches Verhalten) als Assistenten die Lehrenden unterstützen? Genau diese 
Frage wird in dem vom Bundesministerium für Bildung und Forschung geförderten 
Projekt „H.E.A.R.T. (Humanoid Emotional Assistant Robots in Teaching)” an der Phi- 
lipps-Universität Marburg erforscht. Der humanoide Roboter „Pepper“! wird als Assis- 
tent in Lehrveranstaltungen an der Philipps-Universität Marburg eingesetzt, z. B. um 
Aufgaben zu stellen, Quizze durchzuführen und auf Fragen der Studierenden zu ant- 
worten. Pepper ist auf menschliche Aktionen und Reaktionen programmiert und somit 
prädestiniert für Mensch-Maschine-Kommunikation und Mensch-Maschine-Bezie- 
hung. Technisch möglich ist dies durch maschinelle Spracherkennung (mehrere Spra- 
chen), Sprachsynthese, natürlich-sprachlicher Dialogfähigkeit, verbale Kommunikation 
über Gestik, Blickkontakt und Körperhaltung sowie Gesichtserkennung. Das einge- 
baute Tablet ermöglicht zudem den Einsatz für Lehr- und Präsentationsaufgaben. 


Perspektivische Anknüpfungspunkte zu Learning Analytics könnten der Einsatz 
humanoider Roboter als individuelle Lern- und Beratungsassistenten auf Basis der 
analysierten Lernendendaten sein (z. B. aus den Online-Tests zur Vorbereitung auf die 
Präsenzveranstaltung) oder die persönliche Unterstützung von automatisch identifi- 
zierten Studierendengruppen (z. B. hinsichtlich Interesse und Lernniveau) auf elektro- 
nisch verfügbarer Datengrundlage. 


Fazit und Ausblick 


Learning Analytics birgt ein großes Potenzial zur Optimierung von Lehr- und Lernpro- 
zessen, denn datenbasierte Erkenntnisse bieten vielfältige Vorteile für alle Beteilig- 


5 httos://www.project-heart.de/, zuletzt geprüft am 13.07.2018 

3! httos:/Icdn.website-start.de/proxy/apps/a 1tvb2/uploads/gleichzweilinstances/3A26FA88- 
E7D9-41CA-BB2F-DBE354A2A784/weinstances/epaper/a735bb42-2925-4a06-be47- 
122f50374bee/pdflheart_peppers_f%C3%A4higkeiten_broschuere_gro%C3%IF. pdf, 
zuletzt geprüft am 13.07.2018 
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ten. Für Hochschulen ist Learning Analytics interessant und vielversprechend, um 
Risikostudierende frühzeitig zu identifizieren und Studienerfolg zu fördern. Wie 
deutsche Hochschulen von internationalen Erfahrungen mit Learning Analytics profi- 
tieren können, wird derzeit erforscht (Ifenthaler et al. 2017). Für die Bewertung der 
Ergebnisse eignen sich die bereits existierenden Projekte wie MentOR an der Univer- 
sität Duisburg-Essen. Dennoch bleibt festzuhalten: In Deutschland steht der Einsatz 
von Learning Analytics noch am Anfang. Das wiederum bietet „die Chance - früh- 
zeitig und im Dialog mit allen Beteiligten - tragfähige Strategien im Umgang mit der 
Verknüpfung, Auswertung und Analyse von Bildungsdaten zu entwickeln” (Jülicher 
2015, S. 3). 


Abschließend ist zu betonen, dass die Zukunft von Learning Analytics in einer fun- 
dierten, ganzheitlichen Betrachtungsweise durch interdisziplinäre Ansätze und For- 
schungsdisziplinen liegt, die nicht nur Häufigkeiten (z. B. Logins im LMS, Anzahl von 
Foreneinträgen und Gruppendiskussionen, fristgerechte Bearbeitung von Assess- 
ments) zählen, sondern diese mit Inhalten verknüpfen. Die Verbindung von Lehr- und 
Lernforschung, Informatik und Statistik sowie die Einbindung einer ethischen Pers- 
pektive sind folglich essentiell (\fenthaler und Schuhmacher 2016). Wichtige Fragen 
beziehen sich vor allem auf den Datenschutz und die Privatsphäre, den transparenten 
Umgang mit Learning Analytics und Informationen für alle beteiligten Nutzergrup- 
pen. Hierbei sollte verstärkt die Interpretation der Daten im Fokus stehen, die von 
den menschlichen Nutzern zu leisten ist. Die Relevanz menschlicher Präsenz und 
Urteilskraft ist somit elementar im Bildungskontext, wenngleich die Datenaufberei- 
tung mittels Learning Analytics sowie zukünftige Entwicklungen mit Kl-Bezug Lehren 
und Lernen unterstützen können. Perspektivisch denkbar ist die Verarbeitung von 
Lernendendaten auf Basis von deep learning (siehe Einleitung zu Kapitel Technologie 
„Entwicklungswege zur KI”). Die Einbettung von Learning Analytics in ein verant- 
wortungsvolles Change-Management an Hochschulen zählt darüber hinaus zu den 
zentralen Aufgaben ebenso wie die Fragen nach ihrer Nachvollziehbarkeit (Ferguson 
und Clow 2017). Es bedarf weiterer Forschung zum Zusammenhang von Learning 
Analytics und Entwicklungen in der Kl. Der NMC Horizon Report 2017 betrachtet KI 
als wichtigen lehr- und lerntechnologischen Bestandteil für den Hochschulbereich im 
Zeithorizont von vier bis fünf Jahren (Adams Becker et al. 2017). Da Lernen und Leh- 
ren vermehrt online stattfindet und Hochschulen zunehmend Datenmengen von stu- 
dentischen Lernaktivitäten sammeln, können sich vielversprechende Perspektiven 
von Learning Analytics und KI ergeben, die es beispielsweise im Sinne des personali- 
sierten Lernens weiter zu verfolgen, zu erforschen und zu entwickeln gilt. 
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8. Perspektiven der Kl in der Medizin 


Stephan Krumm, Anne Dwertmann 


Gesellschaftliche Entwicklungen, wie steigende Patientenzahlen, aber auch 
der technische Fortschritt und die daraus resultierende Datenflut, stellen 
Medizinerinnen und Mediziner und Forschende vor neue Herausforderungen. 
Das medizinische Wissen wächst in einer nie dagewesenen Geschwindigkeit 
und überholt sich innerhalb kurzer Zeit. Doch diese Herausforderungen bein- 
halten zugleich auch neue Chancen. 


Die Anwendung von Verfahren der Kl kann dazu beitragen, dieses Wissen nutzbar zu 
machen und in der immer komplexer werdenden medizinischen Praxis unterstützend 
wirken. Diese Erkenntnis ist nicht neu: Die Medizin wurde schon vor Jahrzehnten als 
eines der ersten praktischen Anwendungsfelder von KI benannt. Algorithmen mit 
den kryptischen Namen PUFF (Aikins et al. 1983) oder CADUCEUS (Banks 1986) bil- 
deten die Grundlage für die ersten kommerziellen Kl-Produkte Ende der 1980er 
Jahre, wie beispielsweise der Diagnosedatenbank „Diagnosis“ (Ärzte-Verlag 1989). 


Fortschritte im Bereich des tiefen Lernens (Deep Learning, DL) haben in den vergan- 
genen Jahren zahlreiche technologische Entwicklungen in der Medizin angestoßen, 
und eine Vielzahl von Unternehmen und Wissenschaftlern hat sich dem Feld der KI 
zugewandt. Gleichwohl sind frühere KlI-Technologien schon seit vielen Jahren auch in 
Deutschland in der klinischen Anwendung etabliert. Sogenannte Expertensysteme 
und hier im Speziellen wissensbasierte Systeme sind fester Bestandteil der täglichen 
Arbeit in der ambulanten und stationären Versorgung. Genutzt werden solche 
Anwendungen beispielsweise für die Sicherheit in der Arzneimitteltherapie, um Kon- 
traindikationen oder Wechselwirkungen zwischen verschiedenen Medikamenten zu 
vermeiden, und im Bereich der korrekten Diagnose- und Behandlungscodierung. Das 
Wissen darum ist jedoch noch wenig verbreitet, und dementsprechend gering ist das 
Vertrauen in der Bevölkerung: 61 Prozent von rund 1.000 im Rahmen einer Online- 
Studie Befragten würden sich auf eine Diagnose verlassen, die ein Arzt mit Compu- 
ter-Unterstützung erstellt hat. Wenn ein Befund ausschließlich vom Computer 
stammt - beispielsweise durch eine Kl-Anwendung -, wären lediglich 12 Prozent der 
Befragten nicht skeptisch (siehe Abbildung 8.1). 


Ungeachtet dieses Stimmungsbildes ist es sehr wahrscheinlich, dass sich KI-Techno- 
logien in der Patientenversorgung künftig deutlich stärker etablieren werden. Aller- 
dings gilt es noch einige Hürden zu überwinden, wie beispielsweise die noch beste- 
henden Herausforderungen im Umgang mit großen komplexen und unstrukturierten 
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Abbildung 8.1: Persönliche Bereitschaft zu künftigen Möglichkeiten im Gesundheitswesen 
(Auswahl). Befragt wurden 1013 Personen aus ganz Deutschland, repräsentativ für Alter 
(16 +) und Geschlecht; Onlinebefragung (Darstellung angelehnt an BearingPoint GmbH, 
2017). 


Datenmengen zu bewältigen. Für eine flächendeckende Verbreitung von praktischen 
Kl-Anwendungen in Deutschland müssen zudem kluge Datenschutzlösungen gefun- 
den und Berührungsängste von medizinischem Fachpersonal sowie von Patienten 
abgebaut werden. 


Datenwachstum - die zentrale Herausforderung 


Auch wenn Prognosen zur Abschätzung des künftigen globalen Datenvolumens 
schwierig sind und sich teilweise unterscheiden, ist der Trend deutlich: Durch verbes- 
serte oder neue Technologien wird sich die Datenmenge exponentiell erhöhen (Rein- 
sel et al. 2017, Schlömer 2016). Das gilt auch für den medizinischen Bereich. Hier 
tragen verbesserte, höher auflösende Verfahren in der Bildgebung ebenso dazu bei 
wie eine zunehmende Dokumentation von gesundheitsrelevanten Informationen 
durch medizinisches Personal und durch die Patienten selbst. Diese sogenannte digi- 
tale Selbstvermessung (quantified self) erfolgt beispielsweise mit Fitness-Trackern 
und Smartwatches oder mit immer häufiger eingesetzter Sensorik in alltäglichen 
Gegenständen wie Waage, Zahnbürste oder Insulin-Pen. 


Mit dem exponentiellen Datenwachstum geht eine vergleichsweise moderatere 
Zunahme der Anzahl wissenschaftlicher Veröffentlichungen einher. So wurden im 
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Jahr 2014 ca. 2,5 Millionen durch Peer-Reviews beurteilte Artikel in Fachzeitschriften 
publiziert. Die Anzahl von veröffentlichten Artikeln und Fachzeitschriften ist über die 
letzten Jahrzehnte durchschnittlich um drei Prozent jährlich gewachsen; ein Großteil 
dieser Veröffentlichungen entsteht im medizinischen Bereich (Ware und Mabe 2015). 
Grund dafür ist eine generelle Expansion des Wissenschaftsbetriebs und demzufolge 
eine steigende Anzahl an Wissenschaftlerinnen und Wissenschaftlern. 


Es ist anzunehmen, dass zwar mit einer Vervielfachung der verfügbaren Daten zu 
rechnen ist, das daraus tatsächlich abgeleitete Wissen in Form von Publikationen 
jedoch moderater wachsen wird. Die fortschreitende Vernetzung und der bessere 
Austausch der wissenschaftlichen Ergebnisse wird jedoch - wie bereits in den ver- 
gangenen Jahrzehnten - dazu führen, dass immer mehr Wissen individuell verfügbar 
sein wird. Das bedeutet allerdings, dass der Einzelne kaum mehr dazu in der Lage 
sein wird, stets auf der Höhe des aktuellen Wissensstands zu handeln. 


Das medizinische Wissen hat schon jetzt einen Umfang erreicht, der es den Ärzten 
sowie dem Personal medizinischer Einrichtungen fast unmöglich macht, immer auf 
dem Laufenden zu bleiben. Für Ärzte ist es schwierig, sämtliche Behandlungsstrate- 
gien und deren Anwendungsfälle gleichermaßen zu kennen und anzuwenden. Hinzu 
kommt, dass mit der schnellen Vermehrung des medizinischen Wissens vermeintliche 
Gewissheiten von heute auf morgen veralten können. Abhilfe könnten Kl-gestützte 
Programme schaffen, welche anhand von selbstlernenden Algorithmen stets die 
neuesten Erkenntnisse einbeziehen. 


Übung macht den Meister: maschinelles und tiefes Lernen 


Die immensen Fortschritte der Kl in den vergangenen Jahren beruhen im Wesentlichen 
auf einer Kombination des überwachten Lernens (Supervised Learning) mit der Nut- 
zung von Ansätzen des tiefen Lernens. In diesem Zusammenspiel wird ein Trainingsda- 
tensatz als Ausgangsbasis für die Optimierung eines Algorithmus verwendet. Je größer 
der zugrundeliegende Datensatz, desto präziser kann der Algorithmus arbeiten. Dabei 
werden KlI-Methoden insbesondere im Bereich der Analyse von großen unstrukturier- 
ten und schnelllebigen Daten (Big Data) große Hoffnungen zugeschrieben. KI kann 
also dazu beitragen, große Datenmengen hinsichtlich statistischer Zusammenhänge zu 
untersuchen, und somit helfen, neue wissenschaftliche Erkenntnisse zu gewinnen - 
beispielsweise zur Vorhersage von Therapieauswirkungen, als klinische Entscheidungs- 
hilfe und in der Überwachung der Medikamentensicherheit (Lee und Yoon 2017). Bis- 
her steht jedoch die hierfür notwendige bioinformatische Auswertung und praktische 
Nutzung komplexer Datenmengen noch ziemlich am Anfang. So kann zwar das 
menschliche Erbgut für weniger als 1.000 US-Dollar sequenziert werden, aber nur ein 
Bruchteil der dabei anfallenden riesigen Datenmengen lässt sich bisher im Zusammen- 
hang mit einer Krankheit richtig interpretieren und im Sinne einer personalisierten 
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Medizin zur Diagnose bzw. Behandlung der Patienten nutzen. Über verschiedene DL- 
Ansätze sollen hier die Ausgangsqualität der erhobenen Genomdaten (FDA 2016) 
sowie deren Interpretation (Beyer 2016) verbessert werden. 


Eine immer noch bestehende Hürde bei der Verknüpfung von großen Datenmengen 
beispielsweise aus Patientenakten ist die mangelnde Qualität der Erhebung bzw. 
Klassifizierung der Daten. Somit gibt es bislang nur exemplarische Nachweise, dass 
die Nutzung von Big-Data-Technologien in der Klinik einen praktischen Vorteil hat. 
Eine regelhafte Anwendung im klinischen Alltag ist noch weit entfernt. Allerdings 
wird Kl in Verbindung mit DL nicht nur bei Big-Data-Analysen, sondern auch einer 
Vielzahl weiterer potenzieller medizinischer Anwendungen diskutiert. Dies betrifft 
den gesamten Behandlungspfad, von der Krankheitsprävention, über frühe Diag- 
nose, Behandlung und Therapie bis hin zur Nachsorge. 


Radiologie: KI im Vier-Augen-Prinzip 


In der medizinischen Bildgebung wird schon seit mehreren Jahrzehnten auf soge- 
nannte Expertensysteme zurückgegriffen. Im Englischen ist dabei häufig die Rede 
von computer aided detection und computer aided diagnosis (CAD). Die bibliografi- 
sche Referenzdatenbank PubMed listet dazu Studien beginnend ab den 1970er Jah- 
ren auf. Diese Computerprogramme unterstützen die Radiologen bei der Interpreta- 
tion der Bilddaten. Computertomografische Bilddaten können aus mehreren Tau- 
send Einzelaufnahmen bestehen; einen Befund zu erstellen, kann die Radiologin 
bzw. den Radiologen daher unter Umständen viel Zeit kosten. Weil dies zudem eine 
sehr hohe Konzentration erfordert, können sich schnell Flüchtigkeitsfehler in die 
Arbeit einschleichen. 


CAD unterstützt die Radiologen in diesen Fällen mittels Mustererkennung dabei, 
relevante Einzelaufnahmen zu identifizieren und auf Auffälligkeiten hinzuweisen. Es 
hat sich als praktisch erwiesen, mit CAD das klassische „Vier-Augen-Prinzip” zu 
simulieren: Der Radiologe wertet zunächst die Aufnahmen aus, und im Anschluss 
prüft der Computer mittels eines Algorithmus, welche Bildausschnitte zusätzlich 
näher gesichtet werden sollten (Castellino 2005). 


Der größte Unterschied dieser inzwischen gängigen Praxis zu den aktuellen Entwick- 
lungen im Bereich DL ist, dass Menschen die solchen Expertensystemen zugrunde 
liegenden Algorithmen programmierten und diese somit nur einen bestimmten 
Komplexitätsgrad erreichen konnten. DL ermöglicht es nun, dass der Algorithmus 
aus jedem analysierten Datensatz automatisch Erkenntnisse extrahiert, die in die 
Analyse des nächsten Datensatzes einfließen. Sensitivität und Spezifität der Ergeb- 
nisse werden auf diese Weise kontinuierlich optimiert. In erster Linie dienen diese 
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neuen Entwicklungen jedoch der Effizienzsteigerung und Verkürzung der notwendi- 
gen Zeit, die die Ärztin oder der Arzt zur Diagnose und Therapie benötigt. 


Wie dynamisch die Entwicklungen in diesem Bereich aktuell verlaufen, zeigt ein Bei- 
spiel aus den USA: Am 26. September 2017 veröffentlichten die National Institutes 
of Health (NIH) einen von Radiologen annotierten Datensatz aus 112.120 anonymi- 
sierten Röntgen-Thoraxübersichtsaufnahmen mit 14 verschiedenen Pathologien wie 
Pneumonie, Pneumothorax oder Fibrose. Diese Veröffentlichung war verbunden mit 
dem Aufruf an die wissenschaftliche Gemeinschaft, entsprechende Analysealgorith- 
men (auf Basis von KI) zu entwickeln (Summers 2017). Bereits weniger als zwei 
Monate später stellte ein Team der Universität Stanford einen auf Basis von tiefem 
Lernen entwickelten Algorithmus vor, der alle 14 verschiedenen Pathologien erken- 
nen konnte. Und er war nicht nur besser als die bis dahin veröffentlichten Algorith- 
men, sondern erzielte in einem Vergleichstest am Beispiel der Erkrankung Pneumonie 
auch bessere Ergebnisse als vier Radiologen, die jeweils unabhängig voneinander 
insgesamt 420 Aufnahmen auf Hinweise dieser Krankheit ausgewertet hatten 
(Standford University 2017). Die NIH planen, in absehbarer Zeit einen solchen Daten- 
satz auch für den Bereich der Computertomografie zur Verfügung zu stellen (Sum- 
mers 2017). 


Die Anwendungsmöglichkeiten von KI in der Radiologie sind jedoch nicht auf die 
Markierung von derartigen Auffälligkeiten beschränkt. Sobald bei einem Patienten 
beispielsweise ein Tumor oder eine Läsion identifiziert wird, erfolgt dessen bzw. 
deren Vermessung. Neben der Größe und dem Volumen werden dabei auch die 
Konsistenz und die Struktur bestimmt. Eine solche Vermessung, die der Radiologe 
manuell ausführt, ist aufwendig, da unter anderem die Gewebegrenzen in jedem 
Schnittbild genau bestimmt werden müssen, um später die Größe errechnen zu kön- 
nen. Es liegt auf der Hand, dass sich solche Tätigkeiten mit Kl-Methoden automati- 
sieren lassen. 


DL-Algorithmen können zudem dazu beitragen, die Entwicklung einer Krankheit zu 
analysieren. So ist es schon heute möglich, dass Programme aus der elektronischen 
Patientenakte die radiologischen Aufnahmen aus dem Archiv und zugleich das ent- 
sprechende aktuelle Schnittbild automatisiert aufrufen, sodass der Radiologe die Bil- 
der vergleichen kann. Auch kann die Software diese Bilder komfortabel skalieren und 
ausrichten. 


Mithilfe von KI lässt sich auch der gesamte klinische Arbeitsablauf optimieren. Durch 
eine automatisierte Auswertung der anfallenden Bilddaten nach Auffälligkeiten las- 
sen sich beispielsweise Patienten mit akutem Behandlungsbedarf schneller identifi- 
zieren und durch den Computer entsprechend priorisieren. Zudem ist denkbar, dass 
der Kl-Algorithmus die Daten auch nach Auffälligkeiten untersucht, die mit den vor- 
getragenen Beschwerden der Patienten nicht direkt in Zusammenhang stehen. 
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Neben klassischen Expertensystemen zur Bildauswertung kommen inzwischen ver- 
mehrt Produkte auf den Markt, die anhand von tiefem Lernen optimierte Algorith- 
men verwenden. Und nicht nur Branchengrößen wie Siemens, GE oder Philips prä- 
gen diesen neuen Markt, sondern auch kleine Unternehmen und Start-ups. In der 
Praxis beschränkt sich die Anwendung jedoch national wie international noch vor- 
wiegend auf klinische Erprobungen und die medizinische Forschung. 


Elektronische Patientenakte: Der Patient in Bits und Bytes 


Einige der am Beispiel der Radiologie beschriebenen Kl-Anwendungen lassen sich 
ausschließlich in Kombination mit einer elektronischen Patientenakte (ePA) verwirkli- 
chen, beispielsweise der Vergleich neuer mit schon vorhandenen älteren radiologi- 
schen Aufnahmen. Dies beginnt mit einer Digitalisierung bisher papierbasierter 
Dokumente, die anschließend mittels Algorithmen zur Freitexterkennung ausgewer- 
tet und strukturiert aufbereitet werden. Somit können in einer ePA Informationen 
elektronisch gesucht und schnell gefunden werden. Zudem lassen sich beispielsweise 
gezielt und umfassend Arzneimittelreaktionen und Kontraindikationen bestimmen 
und erkennen. Kl kann dazu beitragen, anhand der in einer ePA hinterlegten Daten 
die individuell beste Therapie zu ermitteln. 


Neben den klassischen Kl-Anwendungen wie Arzneimitteltherapiesicherheit und 
Diagnosecodierung werden maschinelles und tiefes Lernen bereits seit einiger Zeit 
bei der Bearbeitung von Patientenakten eingesetzt. Nicht nur Krankenhäuser nutzen 
diese Kl-Methoden, sondern auch Versicherungen (H20.ai 2017). In Deutschland 
sind Anwendungen dieser Kl-Techniken aufgrund der häufig dezentralisierten Spei- 
cherung von Patientendaten aktuell jedoch eine Ausnahme. 


In den vergangenen Jahren haben die Entwicklungen rund um die von IBM entwi- 
ckelte KI-Plattform Watson Health von sich reden gemacht. Laut Herstellerangaben 
setzten im Jahr 2017 sechs Länder Watson in der klinischen Versorgung ein (Bloom- 
berg 2017). Mittlerweile sind Analysen zu zehn verschiedenen Arten von Krebs 
durchführbar. Und das auch online: Auf der Homepage einer indischen Klinikkette 
lässt sich nach dem Upload der eigenen Patientenakte von Watson eine Art Zweit- 
meinungsbericht zum optimalen Behandlungsregime einholen (Manipal Hospitals 
o. J.). In einem Modellprojekt wollte der Krankenhausbetreiber Rhön-Klinikum AG 
Watson auch in Deutschland für Text- und Dokumentenerkennung heranziehen, hat 
dieses Vorhaben jedoch 2017 abgebrochen, um es mit einem anderen Anbieter fort- 
zuführen. 


Welch verblüffende Ergebnisse sich mit einer ePA-Kl-Auswertung erzielen lassen, 
geht zum Beispiel aus einer Studie von Murray et al. hervor. Die Experten nutzten die 
Daten, um Quellen für die Infektion mit dem Krankenhauskeim Clostridium difficile 
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innerhalb einer Klinik zu lokalisieren. Mittels Zeit- und Wegmarken von mehr als 
90.000 Patienten über drei Jahre hinweg konnte eine Karte von Patientenbewegun- 
gen erstellt und ein Kernspintomograph in der Notaufnahme als eine zentrale Quelle 
für Infektionen mit dem Bakterium identifiziert werden (Murray et al. 2017). 


Früherkennung und Prävention: Vorbeugen ist besser als Heilen 


Auf der Grundlage rasch fortschreitender Erkenntnisse zu den molekularen Mecha- 
nismen unterschiedlichster Krankheiten und deren Diagnose mithilfe von Kl rückt die 
Vision näher, Krankheiten bereits in ihrer Entstehungsphase zu erkennen und zu 
behandeln. Bei vielen Indikationen könnte eine frühe Therapie die besten Chancen 
auf Heilung bieten oder sogar komplett und dauerhaft verhindern, dass die Krank- 
heit ausbricht. Ein Beispiel dafür aus der heutigen Gesundheitsversorgung ist die 
Behandlung von Personen mit hohem Cholesterinspiegel, die keine Krankheitssymp- 
tome aufweisen. Mit Arzneimitteln der Gruppe der Statine lassen sich kardiovasku- 
läre Erkrankungen in vielen Fällen verhindern. Jedoch sind kardiovaskuläre Probleme 
von einer großen Anzahl an weiteren Einflussfaktoren abhängig, und damit ist nicht 
klar, welche der behandelten Personen wirklich von der Medikation profitieren, wel- 
chen die Medikation vielleicht sogar eher schadet und bei welchen wiederum zusätz- 
liche Präventionsmaßnahmen dringend geboten sind. In einer Studie der Universität 
Nottingham wurden den bisher angewandten medizinischen Leitlinien vier verschie- 
dene KI-Systeme gegenübergestellt, um aus einem großen klinischen Datensatz vor- 
herzusagen, welche Personen in den kommenden zehn Jahren ein kardiovaskuläres 
Ereignis, wie beispielsweise einen Herzinfarkt, erleiden werden. Alle vier KI-Systeme 
waren den Leitlinien überlegen. Am besten schnitt der Algorithmus ab, der über 
neuronale Netze trainiert wurde. Er sagte nicht nur 7,6 Prozent mehr Krankheits- 
ereignisse korrekt voraus, sondern löste auch 1,6 Prozent seltener falschen Alarm aus 
aufgrund unkorrekter Ergebnisse. In der Gesamtsumme von 83.000 untersuchten 
Patientenakten hätten somit weitere 355 Personen identifiziert werden können, bei 
denen eine präventive Behandlung bzw. Änderung des Lebensstils ein kardiovaskulä- 
res Ereignis unter Umständen hätten verhindern können. KI könnte somit in diesem 
konkreten Anwendungsfall Leben retten (Wenig et al. 2017). 


KI wäre möglicherweise sogar in Lage, auch andere komplexe Krankheiten mit mul- 
tifaktoriellen Auslösern vorherzusagen, beispielsweise neurodegenerative Erkran- 
kungen. Im Rahmen einer italienischen Studie konnte eine Kl so trainiert werden, 
dass sie anhand von Gehirnscans mit großer Zuverlässigkeit erkannte, ob ein Patient 
innerhalb eines Jahrzehnts wahrscheinlich an Alzheimer erkrankt. Dabei wurden mit 
dem bildgebenden Verfahren der Magnetresonanztomographie kleinste Verände- 
rungen in den Verbindungen zwischen verschiedenen Gehirnregionen detektiert. 
Zwar ist die Alzheimer-Demenz bisher nicht heilbar, eine Diagnose im symptomfreien 
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Frühstadium hätte dennoch einige Vorteile. Sie würde es den betroffenen Personen 
beispielsweise ermöglichen, ihren Lebensstil zu ändern, um bekannte Risikofaktoren 
für die Krankheit zu reduzieren. Zudem gibt es Hinweise darauf, dass eine Behand- 
lung mit heute verfügbarer Medikation umso besser wirkt, je früher sie im Krank- 
heitsverlauf angewendet wird. Weiterhin kann mittels der Diagnostik bei ersten 
unspezifischen Symptomen eine Abgrenzung der Alzheimer-Krankheit von anderen 
Formen der Demenz vorgenommen werden. Für den Test von künftig einmal vorhan- 
denen präventiv wirkenden Medikamenten könnte die Diagnostik außerdem dabei 
helfen, geeignete Patienten in klinische Studien einzuschließen. 


Kl-Methoden könnten langfristig dazu beitragen, die Entstehung von Krankheiten zu 
verhindern, was einem Paradigmenwechsel von der jetzigen reaktiven Krankheitsver- 
sorgung zu einer präventiven Gesundheitsversorgung gleichkäme. Um KI für dieses 
Ziel zu trainieren, müssten idealerweise hervorragend strukturierte Daten sehr vieler 
Menschen über einen möglichst langen Zeitraum zur Verfügung stehen - wie es 
beispielsweise in der „All of US“-Kohortenstudie der US-amerikanischen NIH der Fall 
sein wird. Darin sollen eine Million oder mehr Menschen auf freiwilliger Basis über 
viele Jahre hinweg begleitet und ihr Gesundheitszustand, ihre Umwelt und ihr 
Lebensstil detailliert aufgezeichnet werden (National Institutes of Health 2018). 


Der lange Weg zum Einsatz in der Praxis 


Die Verbesserung der Leistungsfähigkeit von Computern sowie der Ausrichtung von 
Chip-Herstellern hin zu dedizierter KlI-Hardware hat dazu beigetragen, dass sich Deep 
Learning und die Anwendung neuronaler Netze stark verbreiten konnten. Die Tür zu 
zahlreichen Anwendungen in der Medizin steht weit offen. Allerdings sind zum Trai- 
ning entsprechender Algorithmen große Mengen an Trainingsdaten notwendig. Das 
Beispiel des NIH-Thorax-Bilddatensatzes verdeutlicht allerdings, wie schnell Algorith- 
men entwickelt werden können, wenn adäquate Basisdaten vorliegen. Grundsätzlich 
lassen sich zwar auch mit kleineren Datensätzen gute Ergebnisse erzielen, die Genauig- 
keit nimmt jedoch mit größerer Fallzahl zu. Daher ist die Verfügbarkeit von, von Ärzten 
annotierten, strukturierten Datensätzen für zukünftige Entwicklungen insbesondere im 
radiologischen Bereich entscheidend. Dieses Nadelöhr haben auch die großen Techno- 
logie- und Gesundheitskonzerne erkannt und versuchen, sowohl durch Firmenzukäufe 
(siehe IBM: Übernahme von Merge Healthcare Inc.°; Dignan 2015 oder siehe Roche: 
Übernahme von Flatiron Health, Inc.°®; F. Hoffmann La-Roche AG 2018) als auch durch 


52 Ein Unternehmen aus dem Bereich medizinischer Bildgebung 
3 Technologie- und Dienstleistungsunternehmen im Gesundheitswesen insbesondere im 
Bereich Onkologie 
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die kostenlose Bereitstellung ihrer KI- und Cloudplattformen den Zugriff auf große 
Datensätze zu erhalten (u. a. Google: TensorFlow, Microsoft: Azure, Apple: Core ML). 


Die weltweit forcierte Sammlung von Daten unter der Überschrift Big Data wird auf 
dem Gebiet der Medizin erheblich dazu beitragen können, neue Erkenntnisse zu 
gewinnen. Zugleich ist es jedoch schwierig, all diese Daten, die aus verschiedenen 
Quellen stammen, gezielt auszuwerten. Hinderlich wirkt sich eine Vielzahl unter- 
schiedlicher Systeme, Methoden, Standards und Formate aus, in denen die Daten 
erhoben und gespeichert werden, sodass sich eine „Silodatenhaltung“ entwickelt 
hat. Erschwerend kommt hinzu, dass die schon erfassten Daten häufig ohne einheit- 
liche Struktur vorliegen. Eine Standardisierung wäre sinnvoll, ist aufgrund der Viel- 
zahl von Akteuren jedoch schwer umsetzbar. KI könnte dazu beitragen, dieses 
Dilemma zu überwinden, indem sie beispielsweise unstrukturierte Dokumente für 
Auswertungen nutzbar macht und eine Vielzahl verschiedener Quellen für Auswer- 
tungen integriert, ohne dass zuvor in großem Maßstab Datenaufbereitungen vorge- 
nommen werden müssten. 


Forschung und Entwicklungen der vergangenen Jahre haben gezeigt, dass KI die 
Diagnostik und Behandlung von Patienten beschleunigen und verbessern kann. Da 
entsprechende Algorithmen jedoch anhand von Patientendaten erstellt werden, 
besteht das Risiko, dass insbesondere Betroffene seltener Erkrankungen nicht im sel- 
ben Maß profitieren können wie jene sogenannter Volkskrankheiten. Bei aller Eupho- 
rie und allen Hoffnungen, die in jüngster Zeit mit KI verbunden sind, bleibt jedoch 
festzuhalten, dass der Praxistest der vorgestellten Deep-Learning-Algorithmen viel- 
fach noch aussteht. Der Abbruch von Projekten mit IBM Watson (Rhön Kliniken, MD 
Anderson Kliniken) verdeutlicht, dass die an die Technologie gerichteten hohen 
Erwartungen aktuell vielfach noch nicht erfüllt werden können. 


Für die Hersteller ergeben sich zudem weitere Herausforderungen in Bezug auf die 
Zulassung entsprechender KI-Produkte: DL basiert auf der stetigen Weiterentwick- 
lung des Algorithmus durch die Nutzung neuer Patientendaten. Es handelt sich somit 
um ein sich ständig veränderndes und sich weiterentwickelndes System. Zwar gibt es 
beispielsweise in der Radiologie mittlerweile erste Entwicklungen, die das Einspeisen 
neuer Untersuchungsalgorithmen in die Kliniksysteme mit vergleichsweise wenig 
Aufwand erlauben, die ständige Weiterentwicklung wirft jedoch auch Fragen der 
Haftung und insbesondere der Zulassung auf. 


Dies gilt auch in Bezug darauf, wie DL-Algorithmen ihre Entscheidungen treffen. Für 
Entwickler ist aufgrund der hohen Komplexität der Systeme nicht immer nachvoll- 
ziehbar, welche Datenmerkmale zu bestimmten Ergebnissen führen (Black-Box-Prob- 
lem). Somit ist es schwierig, eventuelle Fehleinschätzungen der Kl aufgrund zufälliger 
Korrelationen in den Trainingsdaten zu identifizieren. Dies kann ungewollte Folgen 
haben - schlimmstenfalls zum Schaden der Patienten (Bornstein 2016). 
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Ein Beispiel hierfür ist die Entwicklung eines Behandlungsalgorithmus für Pneumo- 
nie-Patienten am University of Pittsburgh Medical Center. Ziel war es, Patienten mit 
geringem Komplikationsrisiko zu identifizieren, um diese anstelle der stationären der 
ambulanten Versorgung zuzuführen. Dazu wurden verschiedene KlI-Methoden zur 
Entwicklung eines entsprechenden Algorithmus genutzt. Neuronale Netze lieferten 
die besten Ergebnisse, allerdings fiel im Nachgang auf, dass der Algorithmus emp- 
fahl, Patienten, die zusätzlich unter Asthma litten, trotzdem ambulant zu behandeln, 
obwohl diese Gruppe eigentlich ein besonders hohes Komplikationsrisiko aufweist. 
Der Grund hierfür war, dass in den bisherigen Behandlungsrichtlinien des Kranken- 
hauses vorgesehen war, Patienten dieser Gruppe auf der Intensivstation zu überwa- 
chen. Wegen der intensiven Behandlung dort hatten sie genau deshalb kaum 
schwere Komplikationen (Caruana et al. 2015). 


Damit einher geht ein negativer psychologischer Aspekt, wenn sowohl für die Ärztin 
oder den Arzt sowie für Patientinnen und Patienten nicht deutlich wird, warum eine 
spezifische Diagnose oder Therapie gestellt bzw. ausgewählt wurde. An der Erhö- 
hung der Transparenz von DL-Algorithmen wird jedoch bereits geforscht (Beuth 
2017). 


Herausfordernd für die Kl-Nutzung in der Medizin ist schließlich auch die Ausgestal- 
tung des Datenschutzrechts. So stellt der Deutsche Ethikrat in seinem Gutachten zu 
Big Data und Gesundheit fest: „Die traditionellen datenschutzrechtlichen Grund- 
sätze des Personenbezugs, der Zweckbindung und Erforderlichkeit der Datenerhe- 
bung, der Datensparsamkeit, der Einwilligung und Transparenz stehen in ihrer 
gegenwärtigen Ausgestaltung der spezifischen Eigenlogik von Big Data entgegen.” 
Um die Vorteile von Big Data umfänglich nutzen zu können, fordert der Rat daher 
alternative Gestaltungsoptionen und Regelungsmechanismen (Deutscher Ethikrat 
2017). 


Ein Baustein der Medizin der Zukunft 


Big Data und KI entfachen in der Debatte um die Medizin der Zukunft viele Hoffnun- 
gen auf bessere Diagnostik und Behandlung. Eng verwoben mit diesen Technologien 
sind allerdings offene Fragen rund um Patientensouveränität und Datenschutz. Spä- 
testens mit dem Gutachten des Deutschen Ethikrats (2017) wurde deutlich, wie 
wichtig es ist, Kl-Anwendungen in der Medizin nicht den großen Internetfirmen zu 
überlassen. Ein Umdenken in Bezug auf die Ausgestaltung von Datenschutzaspekten 
ist notwendig, bei dem auch der Gesetzgeber gefordert sein wird. 


Dass KI dazu beitragen kann, die Qualität und Effizienz der Behandlung von Patien- 
ten zu steigern, belegen seit vielen Jahren Assistenz- und Expertensysteme, die sich 
in der radiologischen Bildgebung fest etabliert haben. Zahlreiche Forschungsprojekte 
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Abbildung 8.2: Wann gelangen KlI-Anwendungen in die Patientenversorgung? 


aus jüngster Zeit spiegeln die Dynamik der Kl-Entwicklung und deren Innovationspo- 
tenzial in der Medizin. Vorstellbar sind Anwendungen über den gesamten Behand- 
lungspfad von Patienten hinweg (siehe Abbildung 8.2) oder auch in der Entwicklung 
neuer Arzneimittel. Ein breiter Einsatz in der klinischen Praxis steht indes noch aus. 


Trotz dieser hohen Entwicklungsdynamik ist jedoch nicht zu erwarten, dass die Tech- 
nologie mittelfristig die Ärzteschaft ersetzen könnte. Zwar ist durch die Erhöhung der 
Produktivität, wie beim Beispiel einer Herzkammersegmentierung binnen 15 Sekun- 
den statt bisher 30 Minuten, damit zu rechnen, dass in einzelnen Fachrichtungen 
unter Umständen weniger Personal benötigt wird. Dies könnte jedoch dazu beitra- 
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gen, die Versorgung aufgrund des zunehmenden Fachkräftemangels zu sichern. KI 
wird also Ärzte nicht ersetzen, sondern unterstützen (Ärzteblatt 2017). 


Auch aus ökonomischer Sicht sind Kl-Technologien vorerst kein Allheilmittel gegen 
steigende Kosten in der Gesundheitsversorgung — im Gegenteil: Die Etablierung 
einer KlI-Infrastruktur wäre zunächst an hohe Investitionen geknüpft, beispielsweise 
zum Aufbau der dafür notwendigen Datenbanken. Nicht zuletzt muss die verstärkte 
Nutzung von KlI-Methoden dem Patienten als vorteilhafte Neuerung nahegebracht 
werden, damit er diese akzeptiert und wirklich von ihr profitieren kann. Bei aller 
Begeisterung um die neuen Möglichkeiten rund um die KI - die Patienten stehen in 
der Medizin im Mittelpunkt. 
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9. Die Rolle der KI beim automatisierten Fahren 


Marcel Kappel, Edgar Krune, Martin Waldburger, Benjamin Wilsch 


Mobilität wird künftig von einer zunehmenden Elektrifizierung, Automatisie- 
rung und Vernetzung der Transportmittel geprägt sein. Während es sich bei 
der Elektrifizierung im Kern um die Ablösung einer bestehenden Antriebstech- 
nologie handelt, erweitern Automatisierung und Vernetzung bestehende 
Mobilitätskonzepte und verursachen somit einen grundlegenden Wandel in 
der Mobilität. Für die automatisierte Steuerung von Transportfahrzeugen, ins- 
besondere von Autos im Straßenverkehr, ist Kl eine unersetzliche Schlüssel- 
technologie und bietet im Zusammenspiel mit der Vernetzung zahlreiche 
Möglichkeiten verkehrsträgerübergreifender Koordination. Allerdings ist die 
Übergabe der Fahrverantwortung an die KI bedenklich für die Sicherheit, 
sodass sich für die Lernphase entsprechend hohe Anforderungen ergeben. 
Die Nutzung von Kl-Methoden zur Gestaltung der Mobilität verspricht jedoch 
einen hohen Sicherheits-, Komfort- und Effizienzgewinn und bietet damit die 
Motivation für intensive Forschungs- und Entwicklungsaktivitäten. 


Trotz der potenziellen Vorteile und der hohen Relevanz von KI in Bezug auf eine intel- 
ligente Mobilität sind die Effekte für Endnutzer heute noch nicht wahrnehmbar, da 
sich in diesem Bereich noch keine wirkliche Breitenwirkung entfalten konnte.’* 
Jedoch wurden im Laufe des vergangenen Jahrzehnts insbesondere durch die Ent- 
wicklung leistungsfähiger und anwendungsorientierter Hardware die technischen 
Voraussetzungen für den Kl-Einsatz im Fahrzeug geschaffen. Deren erfolgreicher Ein- 
satz in der Praxis erfordert allerdings große Datenmengen (Big Data) als Grundlage. 


Aufgrund der zunehmenden Vernetzung der Gesellschaft und der Infrastrukturen 
sind derzeit jedoch die Menge, Vielfalt und Verfügbarkeit dieser Daten gewachsen, 
und es wurden erste Forschungsentwicklungen initiiert, die sich aber vorrangig auf 
Leuchtturmprojekte für intelligente Mobilität konzentrierten. Zudem lassen sich zahl- 
reiche innovative Forschungsarbeiten identifizieren, die auf europäischer, nationaler 
und regionaler Ebene über gezielte Fördermaßnahmen (z. B. Modernitätsfonds, 


5 Tatsächlich gibt es aber durchaus technologische Bereiche, in denen KI mittlerweile eine 
Breitenwirkung erzeugt. Zu nennen ist hier beispielsweise die Analyse von Bild- und 
Videoinhalten mittels tiefem Lernen (Deep Learning, DL- z. B. „Google Photo” und 
„Microsoft Azure“) und die Spracherkennung bei Assistenzsystemen. 


V. Wittpahl (Hrsg.), Künstliche Intelligenz, 
DOI 10.1007/978-3-662-58042-4_11, © Der/die Autor(en) 2019 


iit-Themenband - Künstliche Intelligenz 177 


Deutscher Mobilitätspreis etc.) Unterstützung erhalten. Auch sind erste KI-Bausteine 
in Anwendungen mit Mobilitätsbezug erkennbar, zum Beispiel digitale Assistenten 
oder eine dynamische, multimodale Navigationsunterstützung. 


In der Summe spielt KI in heutigen Mobilitätsanwendungen jedoch noch keine 
wesentliche Rolle. Weder gibt es eine (wirkliche) „Smart City”, in der Verkehrsflüsse 
intelligent und nachhaltig gesteuert und alle Verkehrsträger sowohl untereinander 
als auch mit der Infrastruktur vernetzt wären. Noch existiert eine überzeugende 
Sprachsteuerung, mit der es möglich wäre, ein komplexes Gespräch über längere 
Zeit zu führen, wie es für eine intuitiv nutzbare Fahrer-Fahrzeug-Kommunikation in 
beide Richtungen notwendig wäre. 


Möglicherweise lässt sich der aktuell geringe KI-Einsatz in der Mobilität damit erklä- 
ren, dass auf Daten basierende Lösungen von Mobilitätsproblemen besonders auf- 
wendig sind, denn Mobilität und Verkehr sind ein überaus komplexes Handlungsfeld, 
das einen wachsamen Fahrer in schnell wechselnden Situationen erfordert. Die Her- 
ausforderung für KI besteht also in der Steuerung hoch dynamischer, komplexer Sys- 
teme mit hohem Heterogenitätsgrad. Bevor Kl in diesem Umfeld sinnvoll eingesetzt 
werden kann, muss zunächst eine geeignete und ausreichende Datenlage geschaf- 
fen werden. Die datenmäßige Erfassung, Modellierung und intelligente Analyse sol- 
cher Systeme ist allerdings höchst anspruchsvoll; eine Digitalisierung der Infrastruktur 
von Städten sowie von Fahrzeugen und deren Vernetzung untereinander sind Vorbe- 
dingungen für den Erfolg von KI in der Mobilität. Zwar werden Digitalisierung und 
Vernetzung derzeit mit Hochdruck verfolgt - wenn auch für die Sensorausstattung 
der zu vernetzenden Infrastruktur ein großer Aufwand vonnöten ist -, allerdings ist 
bislang noch kein KI-Einsatz größeren Umfangs erkennbar. Ein Hemmnis ist sicherlich 
die mangelnde Datenverfügbarkeit, weil die datenerhebenden und datenhaltenden 
Akteure so unterschiedlich sind. Und da zumal personenbezogene Datensätze sowie 
Sensorrohdaten von hohem Wert sind, werden sie nicht ohne weiteres Dritten zur 
Verfügung gestellt. 


Wenn diese Hürden aber genommen werden können, wenn also eine umfassende 
und geeignete Datenverfügbarkeit gewährleistet ist, ist die Grundlage dafür gelegt, 
dass sich das enorme Potenzial für den Einsatz von KI in zukünftigen Mobilitätsan- 
wendungen entfalten kann. Dann wird die KI einen wesentlichen Beitrag bei der 
Optimierung von Verkehrsflüssen leisten. Dies gilt gleichermaßen für den Waren- 
und Personenverkehr. Beispielsweise können mittels multimodaler Verkettung Per- 
sonenströme besser aufeinander abgestimmt werden und in der Konsequenz die 
vorhandene Verkehrsinfrastruktur entlasten. Auch können durch geschicktes Len- 
ken der Personen- oder Warenverkehre bisher ungenutzte Freikapazitäten erschlos- 
sen werden. Beispielsweise lassen sich Grünphasen von Ampeln an das Verkehrsauf- 
kommen anpassen. Von großer Bedeutung ist zudem das Potenzial von KI, die 
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Mobilität von morgen sicherer zu gestalten. So wird eine Projektion der möglichen 
Bewegungspfade von Verkehrsteilnehmern an einer Kreuzung die Risikoeinschät- 
zung von Kollisionen oder sonstigen Gefahrensituation im Voraus ermöglichen - in 
Kombination mit einer Warnmöglichkeit ließen sich so Unfälle vermeiden. Aber 
auch auf dem Weg zu einer umweltfreundlicheren Mobilität kann der Einsatz von KI 
viel leisten. Einerseits lässt sich eine Reduktion von Emissionen mittels der bereits 
erwähnten Verkehrsflussoptimierungseffekte herbeiführen, andererseits können 
auch in weniger offensichtlichen Bereichen ressourcenschonende Lösungen gefun- 
den werden, beispielsweise im Bereich der Elektromobilität, indem über eine intelli- 
gente Ladezyklussteuerung die Lebensdauer von Batterien bei gleichzeitig optimier- 
ter Reichweite erhöht werden kann. Schließlich birgt KI nicht nur das Potenzial zur 
Verbesserung bestehender Mobilitätsformen. Für neue Mobilitätsformen wie 
autonome Flugtaxis oder Logistik-Drohnen wird der Einsatz von Kleine entscheidende 
Rolle spielen. 


Fokus der Forschung und Entwicklung liegt auf dem automatisierten Fahren 


Die bisher erwähnten Anwendungsfelder verdeutlichen das weitreichende Potenzial 
von KI für die Mobilität der Zukunft. Trotz der vielfältigen Anwendungsmöglichkeiten 
lässt sich bereits heute erahnen, in welchen Bereichen das primäre Augenmerk der 
Forschung und Entwicklung liegen wird. Ein solcher Bereich ist das automatisierte 
Fahren, was im Folgenden im Sinne eines Beispiels von besonderer Bedeutung näher 
betrachtet wird. Angesichts eines schon bestehenden hohen Automatisierungsgra- 
des im Flug- und Bahnverkehr, wird in Zukunft die größte - potenziell disruptive - 
Veränderung in der Mobilität das automatisierte Fahren sein. Hier schafft KI über- 
haupt erst die technologischen Voraussetzungen für die Automatisierung. Im 
Zukunftsbild einer multimodalen Mobilität, welche die Vorteile der Automatisierung, 
Elektrifizierung und Vernetzung sowie der geteilten Nutzung vereint, kann KI die 
Nutzung von Synergiepotenzialen sowie die verkehrsträgerübergreifende Optimie- 
rung der Reiserouten gewährleisten, wirklich interessant wird ihr Einsatz jedoch dort, 
wo sie Funktionen übernimmt, die bisher nur von Menschen ausgeübt werden konn- 
ten. Die technologischen Durchbrüche in einzelnen Bereichen lassen sich anhand des 
automatisierten Fahrens veranschaulichen und auf andere Segmente der Mobilität 
der Zukunft übertragen. Im Folgenden wird daher der Fokus auf die wesentlichen 
Anwendungen der KI für das automatisierte Fahren gelegt, die sich wie in Abbil- 
dung 9.1 dargestellt zusammenfassen lassen: 
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Automatisiertes Fahren 


Semantische Umfelderkennung 
Fahrzeugsteuerung (Verhaltensplanung und -regelung) 


Abbildung 9.1: Überblick der Anwendungsbereiche der KI für das automatisierte Fahren. 


Wenn der Fahrer mit den verschiedenen Automatisierungsstufen®® immer weniger 
Aufgaben der Fahrzeugsteuerung übernimmt, erhält die KI ein weiteres Anwen- 
dungsfeld, die Fahrer-Fahrzeug-Interaktion. Und bei zunehmender Vernetzung der 


3 Um die verschiedenen Abstufungen des assistierten Fahrens bis hin zum vollautomatisier- 
ten Fahren besser zu beschreiben und zusätzlich auch eine klare rechtliche Abgrenzung 
zu definieren, wurden die fünf Stufen (bzw. sechs bei Berücksichtigung einer nullten Stufe 
für die Fahrzeuge ohne jegliche Assistenzfunktion) des automatisierten Fahren eingeführt 
(National Highway Traffic Safety Administration). Hierbei gilt: Je höher die Stufe, desto 
höher der Automatisierungsgrad. 
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Verkehrsmittel sowie der Infrastrukturen kann KI darüber hinaus den Verkehrsfluss 
optimieren. 


Die genauere Betrachtung des automatisierten Fahrens zeigt, dass KI hierbei zunächst 
genutzt wird, um das Umfeld zu erkennen. In diesem Entwicklungsbereich wurde die 
Zuverlässigkeit der KI z. B. im Rahmen des ImageNet-Wettbewerbs kontinuierlich 
verbessert und übertraf zuletzt sogar menschliche Fähigkeiten (Wu et al. 2015). Auch 
an einer Kl-gestützten Fahrzeugsteuerung wird derzeit intensiv geforscht. Prototypen 
zeigen immer bessere und auch schon zuverlässige Leistungen in komplexen Ver- 
kehrssituationen, wie z. B. in urbanen oder verschneiten Gebieten. Wichtiges For- 
schungsziel ist zum Beispiel das Erlernen einer intuitiven Fahrstrategie. Dass KI tat- 
sächlich Intuition lernen kann, wurde bereits beispielsweise beim Go-Spielen deutlich 
(Silver et al. 2017). Bislang fokussierte sich die Forschung zum automatisierten Fah- 
ren allerdings darauf, prinzipielle Funktionsweisen aufzuzeigen und Leistungsgren- 
zen zu ermitteln. Für den Durchbruch des automatisierten Fahrens wären eine 
effiziente Verarbeitung der zahlreichen Sensordaten in Echtzeit und daher eine 
deutliche Optimierung der Hardware erforderlich. Dabei ist davon auszugehen, dass 
die innerhalb eines Fahrzeugs generierte Datenmenge ständig größer wird. In diesem 
Zusammenhang ist auch (speziell bei Elektrofahrzeugen) der zunehmende 
Stromverbrauch zu berücksichtigen (IEEE Spectrum 2018). Er erhöht sich durch die 
aus Sicherheitsgründen erforderliche Redundanz der Systeme und damit deren 
Kontrolle um ein Vielfaches. 


Der Bedarf an leistungsfähiger und effizienter Hardware für Kl-Anwendungen ist die 
Ursache, dass Autohersteller, Zulieferer und IT-Unternehmen entsprechend kooperie- 
ren und die spezifischen Forschungs- und Entwicklungsarbeiten weiter zunehmen. 
Die Autohersteller haben erkannt, dass sie mit dem vorhandenen Know-how in den 
Unternehmen und dem Ausbildungsstand der Belegschaften die Herausforderungen 
einer Kl-Entwicklung für das automatisierte Fahren nicht erfolgreich werden bewälti- 
gen können. Über Akquisitionen, Investitionen und/oder Kollaborationen verschaf- 
fen sie sich deshalb gegenwärtig Zugang zu den Kompetenzen von auf KI speziali- 
sierten Unternehmen, z. B. VW und Hyundai mit Aurora, Ford mit Argo Al. 


Auswirkungen des automatisierten Fahrens auf die Mobilität 


Das automatisierte Fahren eröffnet Möglichkeiten, die Mobilität der Menschen sowie 
den urbanen Raum einschneidend zu verändern. Es lassen sich drei Visionen anfüh- 


5€ Mittlerweile ist die Verwendung von Kl auch beim intelligenten Batteriemanagement 
durchaus interessant. Jedoch ist der Effekt nicht groß genug, um den signifikanten 
Mehrbedarf in der Zukunft zu kompensieren, der durch die Automatisierung entsteht. 
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ren: Erstens soll die Leistungsfähigkeit des Menschen erweitert werden, da automa- 
tisierte Fahrzeuge die Mobilität für alle (Minderjährige, Senioren und Menschen mit 
Behinderungen) erhöhen oder überhaupt erst ermöglichen. Die zweite Vision ist eine 
deutliche Reduzierung der Verkehrsunfälle. Dies ist ein zentrales Argument für die 
Einführung des automatisierten Fahrens, da mehr als 90 Prozent der jährlich 1,25 
Millionen Verkehrstoten weltweit auf menschliches Versagen zurückzuführen sind 
(Smith 2013). Dies, so die Hoffnung, ließe sich in einem vollautomatisierten und voll- 
ständig vernetzten Verkehrssystem vermeiden. Auf eine Optimierung der Verkehrs- 
flüsse zielt eine dritte Vision, es geht um die Entlastung des urbanen Verkehrs. Dies 
könne z. B. durch eine größere Attraktivität von (neuen) Alternativen zum privaten 
und personenbezogenen Fahrzeug erreicht werden. Die drei Vorstellungen, Mobilität 
durch KI zu verbessern, visualisiert Abbildung 9.2. 


Nutzerakzeptanz als Erfolgsfaktor für das automatisierte Fahren 


Der Durchbruch neuer Technologien hat neben seinen technischen oft auch soziale 
Aspekte. Bis das automatisierte Fahren eine alltägliche und selbstverständliche Ange- 
legenheit für uns alle sein wird, müssen die Entwickler noch einige Hürden auf jeder 
dieser Ebenen überwinden. Zum Beispiel können die notwendigen Lernphasen für 
die unterschiedlichen Kl-Anwendungen, insbesondere wenn es um Sicherheit geht, 
nicht einfach im realen Verkehr stattfinden (siehe Einleitung zu Kapitel Technologie 
„Entwicklungswege zur KI”). Gleichwohl wird der Kl-Algorithmus erst durch Lernvor- 
gänge kontinuierlich besser und robuster. Sind hierfür ausreichend Vergleichsdaten 
in entsprechender Güte vorhanden, kann anhand dieser Datenbasis eine Phase der 
Anwendungsalgorithmen einsetzen, in der sie „angelernt“ werden, z. B. kritische 
Situationen im Straßenverkehr zu erkennen und darauf zu reagieren. Oder sie lernen, 
mittels Spracherkennung intuitiv mit dem Fahrer zu interagieren, die Gefühlslage des 
Fahrers bzw. der Passagiere einzuschätzen, um aktiv darauf einzugehen. 


Wenn auch eine Kl-Anwendung im Laufe der Zeit immer zuverlässiger wird, ist in 
frühen Stadien mit einer hohen Fehlerquote zu rechnen. In den sicherheitsrelevanten 
Anwendungen der Mobilität ist dies jedoch inakzeptabel. Für das automatisierte Fah- 
ren können falsche Ergebnisse etwa beim Erkennen der Umgebung potenziell lebens- 
bedrohlich sein und dürfen weder vom Hersteller noch vom Nutzer hingenommen 
werden. 


Und das automatisierte Fahren wirft weitere Fragen auf, die derzeit ungeklärt sind, 
insbesondere ethischer Natur. Was soll geschehen, wenn das autonome Fahrzeug 
einen unausweichlichen Unfall detektiert und urteilen muss, ob Personen-, Tier-, 
oder Sachschäden vorzuziehen sind (Ethik-Kommission 2017)? Eine Implementierung 
derartiger Entscheidungen in einen Algorithmus möchte wohl kein Autohersteller 
und erst recht keine Ingenieurin und kein Ingenieur verantworten. Auch fehlt derzeit 
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Abbildung 9.2: Überblick der Einsatzbereiche von KI im Fahrzeug sowie der gesellschaftlichen 
Potenziale, die ein hochautomatisiertes und in die Stadt der Zukunft integriertes Fahrzeug 
erschließen kann (eigene Darstellung”). 


eine Rechtsgrundlage, um Unfälle mit Kl-Beteiligung zu bewerten. Es besteht das 
grundsätzliche Problem einer derzeit nicht möglichen Plausibilisierung von 
Kl-Entscheidungen. 


57 Bildnachweise: Thinkstock/metamorworks (Gestiksteuerung und Spracherkennung), 
Adobe Stock/folienfeuer (Umfelderkennung), LVDESIGN (Verkehrs-/Flotten-Management), 
Jackfrog (Fahrerzustandserkennung) 
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Unterschiedliche Entwicklungspfade der Automatisierung durch KI 


Trotz umfangreichen Trainings ist jede durch KI getroffene Entscheidung mit 
Unsicherheiten behaftet - besonders dann, wenn die KI auf Daten außerhalb der 
Trainingsmenge angewandt wird. Aber ab wann ist ein Kl-Assistenzsystem gut genug 
für die praktische Anwendung im Feld? Und wie kann man trotz Lernphase diese 
Technik insbesondere bei Anwendungen, welche die Sicherheit tangieren, in 
vorhandene Systeme etablieren? 


Um eine trainierte KI zu verwenden, müssen also zunächst neue Validierungsmethoden 
und Sicherheitsmechanismen geschaffen werden, mit denen sich fehlerhafte 
Kl-Entscheidungen auffangen lassen. Hierbei haben sich zwei Vorgehensweisen 
etabliert: Ein Ansatz ist die Einbindung der KI über die Teilautomatisierung des 
Fahrzeugs (z. B. Tesla, Audi, Daimler), wobei einzelne Fahrfunktionen in das 
Fahrzeugsystem schrittweise integriert werden (z. B. Update-Möglichkeit bei Tesla). 
Ein weiterer Ansatz (z. B. von Apple und der Alphabet-Tochter Waymo) sieht vor, 
ohne Zwischenschritt direkt hoch- und vollautomatisierte Lösungen zu entwickeln. 


Die Teilautomatisierunghatsich als besonders geeignet füretablierteFahrzeughersteller 
herausgestellt, da hierbei auf bereits vorhandene Fahrassistenzsysteme aufgebaut 
werden kann und somit eine hoch- bis vollautomatisierte Lösung schrittweise über 
verschiedene Automatisierungsstufen angestrebt wird. Ist ein robustes Niveau der 
Fahrfunktion erreicht, kann der Fahrer das Assistenzsystem aktiv freischalten und 
nutzen. Da derzeit keine Validierungsmethoden zur Verfügung stehen, um die 
SicherheitdieserFahrfunktionenzugewährleisten, kannbeidiesemEntwicklungsansatz 
auf den Fahrer als Beobachter, der in brenzligen Situationen unmittelbar eingreift, 
nicht verzichtet werden. Diese Überwachungsfunktion des Fahrers kann allerdings 
schließlich auch Vertrauen in KI aufbauen. 


Im Kontrast dazu entwickeln die neu hinzugekommenen, softwarespezialisierten 
Akteure in der Automobilindustrie direkt vollständig selbstfahrende Fahrzeuge - zum 
Teil bereits ohne Lenkrad. Sie begründen dieses Vorgehen mit Erkenntnissen aus 
Studien, in denen die wechselnde Übergabe der Steuerung zwischen Mensch und 
Maschine untersucht und als zusätzliches Risiko identifiziert wurde. 


Keiner dieser beiden Ansätze hat sich bislang als Königsweg herauskristallisieren 
können. Für beide Wege kann angenommen werden, dass sich in der 
Entwicklungsphase, d. h. im Mischverkehr aus nicht-, teil- und vollautomatisierten 
Fahrzeugen, Unfälle mit Personenschäden nicht ausschließen lassen, und sie sind 
auch schon aufgetreten. 
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Aufbau von Vertrauen in automatisierte Fahrfunktionen 


In der Diskussion um Nutzerakzeptanz gilt es, ungleich gelagerte Toleranzschwellen 
für menschliche und maschinelle Fehler zu berücksichtigen. Wie sensibel die Öffent- 
lichkeit Sicherheit und deren Gewährleistung bzw. Nichtgewährleistung im Mischver- 
kehr wahrnimmt, zeigt bereits der erste tödliche Unfall eines sich im automatisierten 
Modus befindlichen Fahrzeugs - eines Tesla Model S - im Jahr 2016 (The Guardian 
2016). Dieser weltweit diskutierte Vorfall machte deutlich, dass an die Sicherheit 
automatisierter Fahrzeuge deutlich andere Maßstäbe angelegt werden. Dabei schnei- 
det die Fahrleistung des im Unfallwagen verwendeten Autopiloten in einer rein sta- 
tistischen Betrachtung durchschnittlich deutlich besser ab als ein menschlicher Fah- 
rer. Es handelte sich um das erste bekannte Todesopfer bei etwas mehr als 208 Milli- 
onen gefahrenen Kilometern insgesamt, bei denen der Autopilot in einem Tesla 
Model S aktiviert worden war. Im Vergleich dazu: Unter allen Fahrzeugen in den USA 
gibt es etwa alle 136 Millionen Kilometer (National Highway Traffic Safety Administ- 
ration 2017) einen Todesfall®®. Dennoch ist festzuhalten, dass dieser Vorfall für erheb- 
liche Kratzer am Image des automatisierten Fahrens gesorgt hat. 


Da die Unfallzahlen der automatisierten Fahrzeuge zumindest in näherer Zukunft 
deutlich im Fokus einer öffentlichen Debatte stehen werden, geht man davon aus, 
dass diese gerade mit Hilfe von automatisierten und vernetzten Fahrzeugen um min- 
destens eine Größenordnung reduziert werden müssen. Nur dann wird die Bevölke- 
rung diese Fahrzeuge als Assistenzsystem akzeptieren (Shashua 2017). Dass dies 
gelingen kann, zeigt sich daran, dass tatsächliche menschliche Eingriffe in bereits 
vorhandene automatisierte Fahrfunktionen sich stetig verringern. 


Spezielle Hindernisse der Einführung automatisierten Fahrens 


Für die künftige Entwicklung des automatisierten Fahrens insgesamt birgt die gesell- 
schaftliche Wahrnehmung von Unfällen mit dem Fokus auf seltene Einzelfälle und 
einer fehlenden Relativierung das große Risiko einer nur geringen Akzeptanz von 
derart für die Sicherheit bedenklichen Anwendungen. Man stelle sich nur einmal die 
mediale Resonanz auf hypothetische Vorkommnisse vor, wie ein durch Hacking 
manipuliertes Fahrzeug oder gar eine manipulierte autonome Transportdrohne, die 
Täter zum Kidnapping oder als Waffe missbrauchen. Neben der Tragik des Einzelfalls 
würden die davon ausgehenden Schockwellen die Weiterentwicklung automatisier- 


58 Die Aussagekraft des NHTSA-Berichts für den Vergleich der Fähigkeiten menschlicher 
Fahrer mit denen des Autopiloten wird zum Teil kritisch betrachtet, da der Detailgrad 
keine Unterscheidung des Anteils der mit aktiviertem Autopilot gefahrenen Kilometern 
ermöglicht. 
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ter Fahrzeuge - die letztendlich ja der Reduzierung der Unfalltoten dienen sollen - 
erheblich zurückwerfen. Das hypothetische Szenario verdeutlicht, wie wichtig ein gut 
überlegtes Vorgehen bei der Einführung autonomer Fahrzeuge ist. 


Der erfolgreiche Einsatz von KI bei weniger sicherheitsrelevanten Funktionen im 
Fahrzeug, wie der Fahrer-Fahrzeug-Interaktion (intuitive Sprachsteuerung, 
Gefühlserkennung, individuelle Fahrermodellierung etc.) hängt ebenfalls stark von 
der Akzeptanz der Anwender ab. Bei diesen Anwendungen ist mit erheblichen 
Vorbehalten der Nutzer zu rechnen, wenn die KI etwa zum wiederholten Male die 
Gefühlslage fehlinterpretiert und das System entsprechend unangemessen auf den 
Fahrereinwirkt.InAnbetrachtderVielfältigkeitunterschiedlicherFahrerpersönlichkeiten 
wird es auch für technisch fortgeschrittene Algorithmen eine Herausforderung sein, 
adäquate und passende Fahrermodellierungen zu generieren. Gerade zu Beginn der 
Lernphase kann der Nutzen von Kl entweder nur fehleranfällig oder wenig individuell 
sein. Der Verlauf der Lernphase, die Schnelligkeit, mit der eine adäquate Güte der 
Ergebnisse erzielt wird, und die Akzeptanz der Anwender sowie auch der anderen 
Verkehrsteilnehmer sind also essenziell, um KI in der Mobilität zu etablieren und 
letzten Endes das automatisierte Fahren als Ganzes erfolgreich umzusetzen. 


KI-Trainingskilometer zur Erhöhung der Sicherheit 


Eine Verbesserung der Zuverlässigkeit der Kl in der Fahrzeugführung lässt sich vor 
allem durch eine größere Menge an Trainingsdaten erreichen. Dabei kommt es neben 
der Quantität auch auf die Diversität der Daten an, die alle möglichen Szenarien im 
Straßenverkehr in ausreichendem Maße widerspiegeln müssen. Die vorteilhaftesten 
Testbedingungen für autonome Fahrzeuge im öffentlichen Verkehrsraum finden sich 
derzeit in Kalifornien, sodass dort fast jedes Entwicklungsteam Tests durchführt (51 
Unternehmen mit mehr als 300 Fahrzeugen und mehr als 1.000 Testfahrern). 
Aufgrund der Anforderungen der zuständigen Regulierungsbehörde sind diese 
Testfahrten sowie die Anzahl der darin von den Testfahrern vorgenommenen 
Deaktivierungen der Kl-gestützten Steuerung gut dokumentiert. 


Daraus lässt sich einerseits entnehmen, dass sich innerhalb der vergangenen 
dreieinhalb Jahre die Aktivitäten rapide gesteigert haben (siehe Abbildung 9.3). 
Andererseits wird deutlich, dass sich mit zunehmender Fahrleistung - insgesamt 
wurden in Kalifornien mehr als 2,5 Millionen Testkilometer absolviert - ein deutlicher 
Trend zur Reduktion solcher Fälle abzeichnet, in denen der Testfahrer eingreifen 
musste. Mehr als 90 Prozent der in Kalifornien gefahrenen Kilometer haben Waymo 
sowie GM Cruise absolviert. Auch nach der Zulassung für öffentliche Testfahrten in 
weiteren US-Bundesstaaten wie Arizona und Texas liegt Waymo mit einer 
Gesamtfahrleistung von knapp 11,3 Millionen Kilometern seit 2009 - allein die Hälfte 
davon zwischen Juni 2017 und Juni 2018 - vor den Konkurrenten. 
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Abschätzungen zeigen jedoch, dass eine Leistungssteigerung der KI durch eine 
derartige reine Imitation der menschlichen Fahrweise zu aufwendig und zu kostspielig 
ist, um Unfallquoten ausreichend zu reduzieren (Zhao und Peng 2017). Doch durch 
virtuelles Training lässt sich die Diversität sowie das Volumen der Trainingsdaten 
erhöhen. Beispielsweise ergänzt Waymo die bereits diskutierte Fahrleistung im 
Realverkehr mit 2,7 Milliarden Simulationskilometern in unterschiedlichen Szenarien. 
Dazu hat z. B. der Grafikprozessor-Hersteller Nvidia im Januar 2018 das Angebot für 
Entwickler um die Simulationsumgebung AutoSIM erweitert. Um die Zuverlässigkeit 
zu gewährleisten, wird derzeit eine begleitete Berechnung von Sicherheitszuständen 
im Straßenverkehr favorisiert (Shashua 2017), bei denen das Fahrzeug keinen Unfall 
verursachen kann. Analytische Berechnungen sollen somit eine sichere Fahrstrategie 
schaffen. 


Anzahl der Deaktivierungen der KI-Steuerung Anzahl der Testlizenzen für 
pro 1.000 Kilometer (Quartalsdurchschnitt) hochautomatisierte Testfahrten 


SEPTEMBER 2014 SEPTEMBER 2015 SEPTEMBER 2016 SEPTEMBER 2017 


Abbildung 9.3: Anzahl der Deaktivierungen des KI-Steuersystems durch den erforderlichen 
Testfahrer pro 1.000 Kilometer (rote Linie) und Anzahl der erteilten Testlizenzen für 
autonomes Fahren im US-Bundesstaat Kalifornien (orangefarbene Linie). 
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Seltene, aber gefährliche Verkehrssituationen können anhand von synthetischen 
Daten in einem für das Kl-Training ausreichenden Maße repräsentiert werden. Die 
virtuelle Umgebung basiert dabei auf Modellen der realen Welt, die allerdings die 
Frage aufwerfen, welcher Simulationsumfang ausreichend ist, um einen sicheren, 
der menschlichen Fahrfähigkeit überlegenen, Betrieb zu gewährleisten. Möglichkei- 
ten zur Validierung und Zertifizierung Kl-basierter Fahrfunktionen werden daher 
aktuell sowohl auf nationaler - z. B. beim Genesis-Projekt vom Deutschen 
Forschungszentrum für Künstliche Intelligenz (DFKI) und TÜV Süd - als auch auf 
europäischer Ebene - z. B. beim enableS3-Projekt - verfolgt. 


Anwendungsbeispiel: Robo-Taxis 


Ein weiteres Argument für die Einführung selbstfahrender Fahrzeuge ist ihr Potenzial, 
soziale Inklusion zu verbessern. Automatisierte Fahrzeuge können alle Menschen 
individuell und bedarfsgerecht nutzen. Auch heutige Preisschwellen sind nicht länger 
ein Hemmnis für die Mobilität des Einzelnen, denn man muss kein Auto mehr kaufen, 
sondern wie beim Fahrschein im öffentlichen Nahverkehr nur noch eine 
Mobilitätsdienstleistung bezahlen. Und da für automatisierte Fahrzeuge kein Fahrer 
erforderlich ist, werden die Kosten für sogenannte Robo-Taxis im Vergleich zu 
herkömmlichen Taxi- oder Fahrdienstangeboten geringer ausfallen sowie durch KI — 
geplante bessere Auslastung der Fahrzeuge sowie vorbeugende Wartung weiter 
sinken. Zusätzliche Ausgaben für die Software und Sensorik können somit 
kompensiert werden. 


Solche Vorteile sprechen für einen Erfolg der Einführung solcher Angebote; einige 
davon befinden sich bereits im Probebetrieb - z. B. nuTonomy in Boston und Singapur 
- oder gehen gemäß derzeitiger Planungen bereits bis zum Jahr 2020 oder früher in 
den praktischen Betrieb über - wie Navya in Paris oder GM Cruise in den USA. Die 
Marktteilnehmer sind auch in diesem Anwendungsfall sehr heterogen. Neben reinen 
Mobilitätsdienstleistern wie Uber oder Lyft gesellen sich die Original Equipment 
Manufacturer (OEM) oder Erstausrüster der klassischen Automobilindustrie wie die 
Volkswagen AG mit dem Mobilitätsdienstleister MOIA und auch völlig neue Akteure 
im Straßenverkehr wie ioki von der Deutschen Bahn. Das umfangreichste Angebot 
stellt dabei derzeit das „Early Rider Program“ von Waymo in der US-amerikanischen 
Stadt Phoenix dar, für das aus mehr als 20.000 Bewerbungen 400 Teilnehmende für 
eine Probephase ausgewählt wurden, die sich bereits heute jederzeit ein fahrerloses 
Fahrzeug bestellen und für Alltagsaktivitäten einsetzen können. Die Ambitionen von 
Waymo lassen sich darüber hinaus durch den Aufbau des Angebots in weiteren 
US-amerikanischen Städten, z. B. im texanischen Austin, sowie durch die 
Fahrzeugbestellungen bei Fiat Chrysler in Höhe von 62.000 elektrischen Minivans 
und bei Jaguar mit 20.000 I-Pace-Geländewagen belegen. Die Herausforderung 
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besteht nach Angaben des Unternehmens in der Erweiterung in Gebiete mit 
komplexeren Wetter- und Straßenbedingungen. 


Langfristig gesehen könnte diese Entwicklung die Geschäftsmodelle rund ums Auto 
grundlegend verändern. Einerseits wird sich der Anteil des Fahrzeugverkaufs am 
Umsatz verringern, andererseits werden die Einnahmen durch neue Mobilitäts- 
dienstleistungen steigen („Mobility as a Service”). In einem autonomen Fahrzeug 
können den Passagieren auch weitere Dienste angeboten werden, da sie vollständig 
von Aufgaben der Fahrzeugführung entbunden sind. Da sich solche „Shared 
Mobility“-Angebote besonders für den Transport auf den ersten und letzten 
Kilometern einer Reise eignen, eröffnet sich hierdurch auch die Möglichkeit einer 
verkehrsträgerübergreifenden Echtzeit-Routenplanung von Haustür zu Haustür, z. B. 
Moovel von Mercedes oder die Transportation Mobility Cloud von Ford. Dies 
wiederum wird ein Anwendunggsfeld der KI in Form des maschinellen Lernens sein. 


Auswirkungen neuer Mobilitätsangebote 


Die möglichen Auswirkungen der Kl-gestützten Mobilitätsdienstleistungen sowie 
eines neuen persönlichen Mobilitätsverhaltens sind mannigfaltig und lassen sich im 
Einzelnen nicht präzise vorhersagen. Denkbar ist beispielsweise eine Reduzierung der 
Anzahl von Kurzstreckenflugreisen zu Gunsten von automatisierten Übernachtfahr- 
ten oder eine Gegenbewegung zur Urbanisierung dank der effizienteren Nutzung 
der Fahrzeit. 


Zunächst wird interessant sein zu sehen, wie sich der Stadtverkehr entwickelt. Einer- 
seits wird er durch einen besseren Verkehrsfluss entlastet, andererseits kommt jedoch 
zusätzlicher Verkehr auf - etwa aufgrund von Bevölkerungswachstum oder vermehr- 
ten Logistikfahrten, die bereits heute den Stadtverkehr aufgrund von Online-Bestel- 
lungen und anschließenden Einzelauslieferungen belasten. In einem voll- oder hoch- 
automatisierten und mittels KI optimal koordinierten Verkehrssystem, in dem „Shared 
Mobility” verbreitet ist und Fahrzeuge im Privatbesitz eine Seltenheit sind, kann man 
jedoch insgesamt von einer deutlichen Steigerung der Fahrzeugauslastung ausge- 
hen, die bei einem heutigen Stand von unter zehn Prozent (Barter 2013) deutlich 
verbesserungswürdig ist. 


Auch kann aufgrund neuer Mobilitätsangebote der Bedarf an Parkplätzen in den 
Städten signifikant sinken. Dass sich dies in der Folge positiv auf den Verkehrsfluss 
auswirken würde, zeigt sich am Beispiel von Berlin, wo derzeit ein Drittel (Cookson 
und Pishue 2017) der durchschnittlichen Fahrzeit von 22,2 Minuten (Berliner Senats- 
verwaltung für Umwelt, Verkehr und Klimaschutz 2013) der Parkplatzsuche gilt. Die- 
ses Verkehrsaufkommen würde sich bei einer besseren Fahrzeugauslastung 
naturgemäß verringern. 
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Eine umfassende Vernetzung des hochautomatisierten Transports und die 
Bereitstellung von Verkehrsinformationen durch die Infrastruktur kann von einer 
Cloud-basierten KI zur Verkehrsflussoptimierung und zum Flottenmanagement, z. B. 
der Robo-Taxis, genutzt werden. Die Vernetzung ermöglicht zudem eine optimale 
Verkehrskoordination, wobei Fahrzeiten sowie Staus minimiert werden. Dies gilt 
gleichermaßen für die Routenplanung von Lkw-Flotten, für die sich bei 
uneingeschränkten Betriebszeiten eine höhere Flexibilität ergibt. Auch können die 
hohen Datenmengen durch eine zentrale KI ausgewertet und für eine vorbeugende 
Wartung von Fahrzeugflotten verwendet werden. 


Außerdem ist die Ausweitung hochautomatisierter Mobilität auch auf den Luftver- 
kehr denkbar. Derzeit erforschen und entwickeln zahlreiche Teilnehmer dieses neuen 
Markts erste Prototypen (z. B. Airbus, Intel oder Uber) drohnenbasierter Transportmittel. 
Unabhängig von den zu lösenden technischen Fragen sind auch hier die rechtlichen 
und sicherheitstechnischen Aspekte sowie die Nutzerakzeptanz sehr hohe Hürden, 
die eine Einführung auch weit ausgereifter Technologie verhindern können. Denn 
jeder technische Fehler, der zu einem Absturz führt, kann katastrophale Folgen 
haben. 


Neue Dienstleistungen 


Ein zentrales Element der Dienstleistungen, die die Automobilindustrie den Fahr- 
zeuginsassen selbstfahrender Fahrzeuge künftig anbieten könnte, wäre die Interak- 
tion mit einem persönlichen virtuellen Fahrzeugassistenten, bei dem die KI für Spra- 
cherkennung und -verarbeitung sorgt. Da diese Technik in Smartphones und als Teil 
von Smart Homes schon weit verbreitet ist, würde der Einsatz in Fahrzeugen schlicht 
eine Erweiterung der Einflusssphären für diese Technik sein und in Gestalt von Smart 
Cars die Vernetzung vervollständigen. Analog zu den Entwicklungen in den Sektoren 
Smartphone und Smart Home startet jetzt auch in der Automobilindustrie ein Wett- 
kampf um die Erschließung riesige Mengen personenbezogener Daten. Es sind die- 
selben Akteure, die sich gegenüberstehen: Die Entwickler der führenden Sprachassis- 
tenten Alexa - das sind Toyota, BMW und Ford -— sowie von Google — das sind 
Honda, Hyundai und General Motors, durch den Einsatz in Android Auto, außerdem 
KIA - haben bereits begonnen, das Feld unter sich aufzuteilen. Sie treffen jedoch 
auch auf Konkurrenz, die Eigenlösungen anstrebt, dazu zählen Mercedes mit MBUX, 
Baidu Carlife und Apple mit Siri. 


Aufbauend auf den bereits in Smartphones eingesetzten Funktionen kann ein Fahr- 
zeugassistent zusätzlich die biometrische Identifizierung/Authentifizierung der Fahr- 
zeuginsassen, die gestengestützte Anwendungssteuerung sowie eine Fahrer-/Passa- 
gierzustandserkennung übernehmen, woraus sich ein weiteres Anwendungsfeld der 
KI in der Mobilität ergibt. Den Gefühlszustand sowie die Fahrtüchtigkeit zu erfassen 
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spielt beim teilautomatisierten Fahren eine wesentliche Rolle, um Fahrsicherheit zu 
gewährleisten. Beim vollautomatisierten Fahren bieten sie darüber hinaus Möglich- 
keiten an, Dienstleistungsangebote weiter zu personalisieren. Beispielsweise plant 
Toyota aufbauend auf den Assistenten Yui, welcher KI zur Erkennung von Mustern 
und Routinen verwendet, den Zustand des Menschen festzustellen und diese Infor- 
mation dann zu nutzen, um einen empathischen Assistenten zu schaffen. Denn um 
das Vertrauen der Fahrzeuginsassen zu gewinnen, muss ein Fahrzeugassistent die 
Anforderungen eines permanenten Touring-Tests erfüllen. Solche Fahrzeugassisten- 
ten könnten sich beispielsweise in Robo-Taxis schnell bezahlt machen, wenn der digi- 
tale Assistent auch dazu genutzt wird, das Verhalten der Passagiere zu überwachen, 
gegebenenfalls Schäden am Fahrzeug einer identifizierten Person zuschreiben und in 
Rechnung stellen zu können. 


Für die Anwendung von KI in der Mobilität konnte innerhalb des zurückliegenden 
Jahrzehnts die Entwicklung von Hardware und Algorithmen die notwendigen Fort- 
schritte machen. Besonders in den vergangenen Jahren kam es zu einem rasanten 
Anstieg der Forschungs- und Entwicklungsaktivitäten. Im Fokus steht zumindest in 
Deutschland das Automobil, da hier mit der Ablösung des Privatfahrzeugbesitzes ein 
fundamentaler Umbruch bevorsteht. Dieser Wandel bereitet völlig neuen Anwen- 
dungen den Weg, und damit einhergehend locken völlig neue Geschäftsmodelle 
auch neue, überwiegend KI-fokussierte Marktteilnehmer an. Ziel der Entwicklungen 
ist ein vollständig automatisiertes Verkehrssystem, welches ermöglicht, sowohl die 
Unfallrate zu reduzieren und die soziale Inklusion der Mobilität zu steigern als auch 
das Verkehrsmanagement in Verbindung mit einer besseren urbanen Raumplanung 
zu optimieren. Allerdings entsprechen der Stand der Vernetzung und Digitalisierung 
von Fahrzeugen und Infrastruktur sowie objektiv unverhältnismäßig hohe Anforde- 
rungen an das Sicherheitsniveau noch nicht den Anforderungen eines umfassenden, 
von der Gesellschaft akzeptierten Einsatzes. Da die Entwicklungsstrategien unter- 
schiedlich und die möglichen Entwicklungspfade mannigfaltig sind, lässt sich zum 
heutigen Zeitpunkt nur schwer abschätzen, wann hochautomatisiertes Fahren selbst- 
verständlicher Teil des Straßenverkehrs sein und sich das Mobilitätsverhalten auf- 
grund von individuell wirksamen Kl-Anwendungen verändert haben wird. 


Vor allem sind zusätzliche disruptive Veränderungen, z. B. die Einführung von Droh- 
nen-Taxis, sowie Entwicklungssprünge im Bereich der Kl-Hardware nicht auszuschlie- 
Ben. Für eine Prognose lassen sich jedoch als Referenz europäische Roadmaps heran- 
ziehen, die hochautomatisiertes Fahren im Jahr 2030 als etabliert betrachten (ERTRAC 
Arbeitsgruppe Connectivity and Automated Driving 2017). Auf internationaler Ebene 
kann die als Teil einer sektorübergreifenden Kl-Initiative erteilte Vorgabe der chinesi- 
schen Regierung gelten, die eine Etablierung von autonomen Fahrzeugen für den 
Autobahnverkehr innerhalb von drei bis fünf Jahren und für den Stadtverkehr bis 
2025 als Richtschnur festschreibt. Auch wenn China bereits über umfangreiche KI- 
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Kompetenzen verfügt (Baidu, Tencent usw.), ist diese Richtlinie in Anbetracht der 
diskutierten notwendigen Voraussetzungen allerdings als sehr ambitioniert 
einzustufen. 


In Anbetracht einer deutlichen Zunahme von Testbetrieben im öffentlichen Verkehr 
darf man allerdings von einer deutlichen Intensivierung und Beschleunigung der Ent- 
wicklungstätigkeiten ausgehen. Zuletzt wurde im Februar 2018 mit der Zulassung 
von Waymo als Fahrdienstvermittlungsunternehmen im US-Bundesstaat Arizona der 
Grundstein für eine graduelle Einführung von Robo-Taxidiensten in den Städten 
gelegt. Nahezu gleichzeitig schuf Kalifornien die rechtliche Grundlage für den Betrieb 
autonomer Fahrzeuge im öffentlichen Verkehr ab April 2018. Voraussichtlich werden 
Kl-gestützte Transportangebote bereits in naher Zukunft einen Teil der Alltagsmobilität 
ausmachen und das Mobilitätsverhalten langfristig grundlegend verändern. 
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10. Maschinelle Übersetzung 


Antonia Schmalz 


Das Internet ist dazu geeignet, Wissen zu demokratisieren und Informationen 
allen zugänglich zu machen sowie Zusammenarbeit zu fördern. Grundvoraus- 
setzung dafür ist jedoch, dass man sich gegenseitig versteht. Ein automati- 
sches Übersetzungssystem könnte helfen, Sprachbarrieren zu überwinden, 
doch die menschliche Sprache ist komplex und mehrdeutig. Übersetzungen 
können vom Kontext abhängen oder zusätzliches Wissen erfordern. Versuche 
der maschinellen Übersetzung lieferten daher bisher unzuverlässige und unna- 
türliche Ergebnisse. Kl-Methoden könnten endlich Abhilfe schaffen: Künstli- 
che neuronale Netze (KNN) sind in der Lage, selbstständig aus großen Daten- 
sätzen zusätzliches Wissen zu extrahieren, z. B. darüber, welche Wortkombi- 
nationen in einem bestimmten Kontext sinnvoll oder welche Formulierungen 
üblich sind. So kann es gelingen, der Vision, menschliche Sprache möglichst 
natürlich und korrekt wiederzugeben, tatsächlich einen Schritt näher zu kom- 
men. 


Laut Überlieferung der Bibel scheiterte bereits das Projektmanagement des Turmbaus 
zu Babel daran, dass die Strafe für dieses vermessene Vorhaben eine effiziente Kom- 
munikation durch eine fehlende gemeinsame Sprache und damit die Errichtung des 
Turms selbst unmöglich machte. Zu den Menschheitsträumen zählt seither so etwas 
wie ein Universalübersetzungsgerät, allerdings gibt es das bislang nur in der Science- 
Fiction, etwa in Douglas Adams Buch „Per Anhalter durch die Galaxis”. Darin tritt der 
Universalübersetzer durch einen „Babelfisch” in Erscheinung, dessen Namensge- 
bung wieder auf die erste bekannte Problemsituation dieser Art verweist. Der Babel- 
fisch ermöglicht demjenigen, der ihn im Ohr trägt, direkt in einer ihm fremden Spra- 
chen zu kommunizieren. 


Als nun in den vergangenen Jahrzehnten die Welt durch das aufkommende und 
explosionsartig wachsende Internet näher zusammenrücken konnte und Informati- 
onsaustausch und Zusammenarbeit globaler wurden, spürte man erneut schmerzlich 
das Fehlen eines funktionstüchtigen Übersetzungswerkzeugs. So wurde im Jahr 
1997 auch der erste Babelfisch vermeintlich Realität. Der Online-Dienst Babel Fish 
der Suchmaschine AltaVista, später Yahoo, übersetzte Texte auf Knopfdruck zwi- 
schen 36 Sprachenpaaren aus 13 Sprachen. Die zugrundeliegende Software der 
Firma Systran nutzte ein regelbasiertes Übersetzungssystem, das manuell vordefi- 
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nierte Syntax- und Grammatikregeln sowie Wörterbücher der betrachteten Sprache 
beherrschte und Sätze Wort für Wort abarbeitete. 


Schnell zeigten sich jedoch die engen Grenzen dieser maschinellen Übersetzung. 
Ohne jegliche Alltagserfahrung und ohne ein zumindest rudimentäres „Verständnis” 
für die Zusammenhänge im Satz oder gar im gesamten Text ist es dem Computer 
nicht möglich, Mehrdeutigkeiten aufzulösen. Handelt es sich nicht gerade um einen 
Horrorroman, ist jedem menschlichen Leser mit einer gewissen Lebenserfahrung 
ohne weiteren Zusammenhang klar, dass für die Aussage „Ich öffnete das Einmach- 
glas mit meiner rechten Hand” kein Blut fließen musste. Zur zweifelsfreien Interpre- 
tation des Berichts „Ich traf den Sohn des Nachbarn mit einem blauen Ball” ist hin- 
gegen auch für den Menschen mehr Kontext nötig. Ein Computer ohne Lebenser- 
fahrung, der nur einzelne oder wenige Wörter im Zusammenhang betrachtet, muss 
hier scheitern. 


Die Babel-Fish-Webseite wurde daher weithin berühmt für die Kreation absurder 
Aussagen - im deutschen Sprachraum insbesondere für die maschinelle Übersetzung 
der Starr-Reporte zur Lewinsky-Affäre des damaligen US-Präsidenten Clinton, die 
AltaVista 1998 zuerst stolz direkt auf der Startseite verlinkte. Als die Internetreaktio- 
nen klarmachten, dass Übersetzungen wie „Im Verlauf des Flirtings mit ihm hob sie 
ihre Jacke in der Rückenseite und zeigte ihm die Brücken ihrer Zapfenunterwäsche.“ 
(z. B. Strassmann 1998) keine Werbung für den Babel Fish waren, wurde der Text 
wieder entfernt. Der Babel Fish konnte dennoch im Jahr 2001 ca. 1,3 Mio. Überset- 
zungen pro Tag verzeichnen (Yang 2003). Sein Nutzen war, den Lesenden schnell 
und unkompliziert die wesentliche Aussage zu vermitteln, sogenanntes „gisting” — 
nicht einen publizierbaren Text zu generieren. 


Bis ins Jahr 2018 hat sich die Qualität der maschinellen Übersetzung durch den Über- 
gang zu selbstlernenden Systemen (siehe Einleitung zu Kapitel Technologie „Ent- 
wicklungswege zur KI”) zwar deutlich verbessert, die grundlegenden Probleme und 
Herausforderungen sind aber die gleichen geblieben. Die Tatsache, dass einem Com- 
puter die für die kontextsensitive Übersetzung nötige Alltagserfahrung fehlt, legt 
sogar die Vermutung nahe, dass eine zuverlässig fehlerfreie, maschinelle Überset- 
zung nie möglich sein wird (Winther Madsen 2009). 


Abbildung 10.1 zeigt links eine maschinelle Übersetzung nach dem aktuellen Stand 
der Technik eines beliebig ausgewählten Textes aus der New York Times. Der Sinn des 
ersten Satzes ist nicht zu entnehmen, da die Doppeldeutigkeit des englischen Wortes 
„skate“ (hier eigentlich „Rochen”, nicht „Schlittschuh“) falsch aufgelöst wurde und 
„land vertrebrates“ (eigentlich Landwirbeltiere, nicht Landwirt) falsch übersetzt 
wurde. Die nachfolgenden Sätze sind jedoch gut verständlich. 
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ENGLISCH w 


You can trace the heritage of little skates and 
land vertebrates back to a common ancestor 
that lived about 420 million years ago. 


This primitive fish gave rise to the vast majority 
of vertebrate species, including all fish with 
paired fins. Typically, these pectoral and pelvic 
fins — which correspond to forelimbs and 
hindlimbs in land vertebrates — are small and 
largely used for balance and steering. To really 
propel themselves, most fish wriggle their 
powerful tails. 


B Anwendung 


DEUTSCH w 


Sie können das Erbe der kleinen Schlittschuhe und 
Landwirte auf einen gemeinsamen Vorfahren 
zurückverfolgen, der vor etwa 420 Millionen 
Jahren gelebt hat. 


Aus diesem primitiven Fisch entstanden die 
meisten Wirbeltierarten, einschließlich aller Fische 
mit gepaarten Flossen. Typischerweise sind diese 
Brust- und Beckenflossen - die Vordergliedmaßen 
und Hintergliedmaßen in Landvertebraten 
entsprechen - klein und weitgehend für 
Gleichgewicht und Steuerung verwendet. Um sich 


selbst voranzutreiben, winden die meisten Fische 
ihre mächtigen Schwänze. 


Abbildung 10.1: Textausschnitt aus einem zufällig ausgewählten Artikel der New York Times 
sowie das Ergebnis der maschinellen Übersetzung mit Google Translate (eigene Darstellung). 


Der heilige Gral der maschinellen Übersetzung wird jedoch auch für die nahe Zukunft 
unerreicht bleiben, nämlich eine zuverlässig korrekte, aber vor allem auch eine natür- 
lich klingende Übersetzung zu erzeugen. 


Anwendungen 


Was ein Übersetzungsprogramm wirklich leisten muss, hängt stark vom Zweck ab. 
Wird eine automatische Übersetzung im kommerziellen, politischen oder juristischen 
Umfeld genutzt, ist es für die Außendarstellung eines Unternehmens wünschenswert 
oder rechtlich sogar nötig, dass die Übersetzung vollständig korrekt ist. Beispiele 
hierfür sind die Pflege der Webseite eines internationalen Unternehmens oder Proto- 
kolle von internationalen, politischen Tagungen. Hier müssen menschliche Überset- 
zerinnen und Übersetzer den Text in jedem Fall nachbearbeiten, und das Überset- 
zungsprogramm dient im Wesentlichen der Zeitersparnis. Die Einsatzdomänen sind 
meist sehr spezifisch, a priori bekannt, und oftmals existieren schon individuell 
gepflegte Datenbanken mit verifizierten Übersetzungen von Phrasen, Sätzen und 
Textabschnitten, auf die ein Programm zurückgreifen kann und die wiederverwendet 
werden können (Übersetzungsspeicher). Die Übersetzungsprogramme können sehr 
speziell auf die jeweiligen Anwendungsdomänen ausgerichtet und für diese vorkon- 
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figuriert werden. Eine Ausnahme sind zum Beispiel Filmuntertitel, die verschiedenste 
Bereiche berühren können. Anbieter von Übersetzungsprogrammen, die primär die- 
sen Markt adressieren, sind z. B. Omniscien Technology, SDL, Yandex oder Systran. Im 
Angebot sind sowohl Serverlösungen, die der Kunde - z. B. aus Sicherheits- und 
Geheimhaltungsgründen - direkt bei sich betreiben kann, als auch Cloud-Services. 
Die maschinelle Übersetzung hat für diese Anwendungen eine überwiegend wirt- 
schaftliche Bedeutung, in dem Sinn, dass primär Kosten und Zeit von sonst nötigen 
professionellen Übersetzern eingespart werden können. 


Auf der anderen Seite gibt es Anbieter wie Google, Microsoft, DeepL oder auch 
Facebook und Amazon, die eine Generalübersetzung zur Verfügung stellen wollen 
- als Service für den Internetnutzer, den Social-Media-Nutzer, Reisende, die die 
Online-Bewertung von Hotels verstehen möchten, oder den Hausmann, der das 
leckere Bibimbap aus dem letzten Asienurlaub möglichst original nachkochen 
möchte. Solche Übersetzungsprogramme müssen alle möglichen Domänen abde- 
cken können, es ist aber meistens ausreichend, wenn sie den Sinn des Ursprungstex- 
tes wiedergeben können. In diesem Anwendungsfeld ist neben einem wirtschaftli- 
chen Nutzen vor allem auch ein gesellschaftlicher Vorteil zu sehen, da die Kommuni- 
kation über Sprachgrenzen erleichtert wird, und insbesondere auch mehr Menschen 
Zugang zu Wissen und Informationen bekommen, die etwa im Internet im Wesent- 
lichen auf Englisch verfügbar sind (siehe auch Sprachenerweiterung und „Low- 
Resource Languages”). 


Nicht zu vernachlässigende Treiber der Entwicklung von Übersetzungsprogrammen 
sind auch Polizei und Militär. Im Rahmen der Terrorismusbekämpfung soll gegebe- 
nenfalls automatisiert fremdsprachige Kommunikation nach Hinweisen auf verdäch- 
tiges Verhalten durchsucht werden, die über einzelne Schlagwörter hinausgehen. 
Auch Soldaten in den Einsatzgebieten sollen in der Kommunikation mit der Bevölke- 
rung vor Ort unterstützt werden. 


Durch zunehmend international agierende Unternehmen und sprachübergreifende 
Social-Media-Anwendungen entsteht ein starker „Application Pull”, auf den ver- 
stärkt und verstärkend wirkend ein „Technology Push” durch die drastische Weiter- 
entwicklung von Deep-Learning-Algorithmen und neuronalen Netzwerken trifft. 


Die Übersetzungsalgorithmen, die derzeit weiterentwickelt werden, sind selbstler- 
nende Systeme ohne vorgegebene Sprachregeln, die bei der Übersetzung mehr als 
ein einzelnes Wort im Zusammenhang betrachten können. Hierfür werten sie eine 
möglichst große Datenbank von Texten aus, die parallel in den betrachteten Spra- 
chen vorliegen (Prinzip des Rosettasteins). Üblicherweise ist ein zentraler Bestandteil 
dieser Datenbank das Archiv der Vereinten Nationen mit mehreren Milliarden Wör- 
tern in zahlreichen Sprachen. 
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Statistische Maschinelle Übersetzung (SMT) 


Im Jahr 2007 führte Google als einer der ersten Anbieter ein selbstlernendes Über- 
setzungssystem ein, das Datenbanken statistisch auswertete (Statistical Machine 
Translation, SMT) und so die wahrscheinlichsten Übersetzungen eruierte. Aktuell 
werden bei der statistischen Übersetzung jeweils eine Reihe von aufeinanderfolgen- 
den Wörtern gleichzeitig betrachtet (Phrase-based Machine Translation, PBMT) und 
damit auch die Häufigkeit von Wortkombinationen evaluiert, wodurch implizit auch 
der Kontext zu einem geringen Grad berücksichtigt wird, wenn die sinnrelevanten 
Wörter eng genug beisammenstehen. 


Probleme treten hier vor allem bei Sprachpaaren auf, bei denen sich die Wortreihen- 
folge und/oder die grammatikalische Struktur stark unterscheiden. Durch die Einbin- 
dung zusätzlicher Sprachmodelle, „Reordering”-(Umsortierungs-)Modellen und wei- 
terer unterstützender Algorithmen wird diesen Defiziten entgegengewirkt. Durch 
den statistischen Ansatz entsteht außerdem eine starke Abhängigkeit vom Trainings- 
material. Trainiert man etwa als Extrembeispiel einen Algorithmus ausschließlich mit 
Texten aus der Zoologie, wird in der anschließenden Übersetzung eines Berichts über 
ein Baseballspiel das englische Wort „bat” trotzdem immer als „Fledermaus”, nicht 
aber als „Schläger“ wiedergegeben werden. Im ersten Hype um das damals neue 
Verfahren zitiert die Zeitschrift Computerbild (Hülsbörner, 2007) Philipp Köhn, einen 
der Mitentwickler der SMT: „Technische und politische Texte können wir völlig prob- 
lemlos übersetzen lassen - von Sportberichten und Kochrezepten lassen wir dagegen 
lieber die Finger”. Ursache dieser Einschätzung war die thematische Beschränkung 
der Themen, die in den frei verfügbaren und zum Training nutzbaren Texten der Ver- 
einten Nationen oder Europäischen Union existiert. 


Neuronale Maschinelle Übersetzung (NMT) 


Im November 2016 führte Google dann mit großer Medienresonanz das erste Über- 
setzungssystem ein, das sich eines neuronalen Netzes (Neural Maschine Translation, 
NMT) bediente und versprach, mit natürlicheren Sätzen die Lücke zwischen mensch- 
licher und maschineller Übersetzung zu schließen („Bridging the Gap between Human 
and Machine Translation”; (Yonghui Wu et al., 2016)). Bis dato gab es zwar vielver- 
sprechende Arbeiten zur Nutzung neuronaler Netze, die NMT-Systeme schnitten aber 
im Praxistest schlechter ab als ausgereifte SMT-Übersetzer. Google konnte erstmals 
verschiedene Schwächen, wie etwa die langsamere Trainingsgeschwindigkeit, die 
ineffiziente Behandlung von seltenen Wörtern oder das Problem, dass manchmal 
nicht alle Wörter des Ursprungssatzes übersetzt wurden, erfolgreich ausgleichen. 


Anders als bei der SMT wird bei der NMT immer ein vollständiger Satz gleichzeitig 
betrachtet. Mathematisch wird von einer linearen Abbildung zwischen Eingangs- 
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und Ausgangssprache in der SMT übergegangen zu einer nicht-linearen Abbildung 
in der NMT, basierend auf einer Vektordarstellung des Ein- und Ausgangssatzes über 
mehrere Zwischenstufen und mehrere Abstraktionsgrade. Dadurch kann jedes ein- 
zelne Wort jeweils in der Abhängigkeit von allen anderen Wörtern im Satz betrachtet 
werden. Zusätzliche Sprachmodelle sind hier nicht nötig. Durch die gleichzeitige 
Betrachtung eines vollständigen Satzes mit allen Abhängigkeiten können NMT-Algo- 
rithmen insbesondere besser mit sogenannten „long-distance dependencies” umge- 
hen, d. h. getrennten Satzteilen, die grammatikalisch und/oder inhaltlich voneinan- 
der abhängen und die Aussage stark beeinflussen können. Besonders im Deutschen 
sind solche „long-distance dependecies“ häufig: „Für die Geburtstagsfeier der drei- 
jährigen Lise brachte der Vater ein Kaninchen mit einer blauen Schleife mit/um.” 
Auch Sprachpaare, bei denen die Wortreihenfolge stark unterschiedlich ist, beherrscht 
NMT besser. Die starke Abhängigkeit von Umfang, Qualität und Ausrichtung des 
Trainingsmaterials besteht jedoch auch hier. Allgemein erzeugen NMT-Systeme deut- 
lich natürlicher klingende, für den Menschen verständlichere Sätze als SMT-Systeme, 
die auch den Inhalt besser wiedergeben. Die Satzstruktur ist besser, es gibt weniger 
Syntaxfehler und weniger Fehler in der Wortreihenfolge. 


Auf der Webseite des Übersetzungsprogramms Microsoft Translator (Microsoft) kann 
der interessierte Nutzer selbst vergleichende Tests durchführen und ein Gefühl für die 
jeweilige Übersetzungsqualität bekommen. Die beiden Beispiele in Abbildung 10.2 
demonstrieren einerseits das bessere Niveau der NMT-Übersetzung, andererseits aber 
auch die immer noch vorhandene Unzulänglichkeit bei Übersetzungen, die ein Ver- 
ständnis der Aussage erfordern. 


Auch wenn nach Google im Verlauf des Jahres 2017 fast alle großen Anbieter von 
Übersetzungswerkzeugen, wie Microsoft/Bing, Yandex, Systran, SDL oder Omniscien 
Technologies, die NMT-Technologie in ihre Systeme integriert haben, wurde dadurch 
der SMT-Algorithmus nicht automatisch ersetzt. Oftmals werden hybride Verfahren 
angeboten, die die Vorteile beider Ansätze nutzen. So lassen sich bei SMT-Algorith- 
men etwa leichter problem- bzw. anwendungsspezifische Datenbanken einbinden, 
die eine bestimmte fachspezifische Terminologie oder regelmäßig wiederkehrende 
Sätze und Formulierungen mit verifizierter Übersetzung (Übersetzungsspeicher) ent- 
halten. Anders als NMT kann dies dadurch auch sicherstellen, dass feste Bezeichnun- 
gen über einen Text hinweg konsistent übersetzt werden. Abhängig vom Anwen- 
dungszweck, der Anwendungsdomäne, dem verfügbaren Trainingsmaterial und 
auch dem betrachteten Sprachenpaar kann SMT auch die bessere Übersetzungsqua- 
lität liefern (siehe z. B. M. Farajian et al.). 


Im August 2017 trat überraschend ein neuer Player auf den Markt. Das deutsche 
Unternehmen DeepL behauptet auf seiner Webseite (DeepL) unbescheiden, dass „im 
Blindtest [...] DeepLs Resultate etwa drei Mal so häufig als beste Übersetzung gewählt 
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DEUTSCHw 


Zum 15. Jahrestag von 9/11 erklärt Expertin Amanda Ripley, wieso manche Menschen im World 
Trade Center auf die Anschläge vorbereitet waren und sich retten konnten — und andere nicht. 


ENGLISCHw 

SMT NMT 

To the 15th anniversary of 9/11, an expert does On the 15th anniversary of 9/11, expert Amanda 
not explain Amanda Ripley, why some people in Ripley explains why some people in the World 

the World Trade Center to the attacks were Trade Center were prepared for the attacks and 
prepared and could — save yourself and saved themselves — and not others. (korrekt: - and 
others.others not) others not) 

DEUTSCH w 


Zwei Tage später veränderte sich alles in seinem Leben, als er nach der Physiotherapie mit dem 
Auto zum Trainingszentrum fahren wollte - dieses aber nicht mehr erreichte. 


ENGLISCH w 

SMT NMT 

Two days later everything in his life changed but Two days later, everything changed in his life 

no longer reached when he wanted to — go after when he wanted to drive to the training center by 
the physiotherapy training centre by car this. car after physiotherapy — but this was no longer 


achieved. (korrekt: reached) 


Abbildung 10.2: Auf der Webseite des Microsoft Translators (Microsoft) können eigene Texte 
oder Beispielsätze aus einer Datenbank mit den beiden verfügbaren Algorithmen (SMT, NMT) 
übersetzt werden (eigene Darstellung der Übersetzungsergebnisse). 


werden, wie die der anderen.” Die zugrundeliegenden neuronalen Netze sind bei 
DeepL erstmals keine sogenannten rekurrenten neuronalen Netze, sondern „Convo- 
lutional Networks“. Solche Architekturen sind für die Bilderkennung üblich, für die 
Übersetzung gab es bisher Forschungsarbeiten - auch z. B. von Google und Facebook 
-, aber keine kommerziellen Implementierungen. Der Vorteil von Convolutional Net- 
works ist, dass alle Wörter parallel übersetzt werden können und bereits optimierte 
Bibliotheken für die Berechnung existieren (Merkert, 2017). Darüber hinaus profitiert 
die Qualität des DeepL-Systems von einem weiteren Faktor. DeepL bot vorher unter 
dem Firmennamen Linguee eine Suchmaschine für Übersetzungen an und konnte 
damit extrem umfangreiche, qualitativ sehr hochwertige Trainingsdaten sammeln. 
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Die zentrale Technologie der Zukunft wird sicherlich ein selbstlernendes System jen- 
seits der rein statistischen Methoden sein. Das ist neben der reinen Qualitätsdebatte 
unter anderem auch begründet durch die Möglichkeit von Zero-Shot-Übersetzun- 
gen, das heißt direkte Übersetzungen zwischen Sprachenpaaren, für die keine paral- 
lelen Texte zum Training vorliegen (siehe auch Textfundus). Welche Ausprägung sich 
durchsetzt und welche Versprechen und Visionen damit tatsächlich erfüllt werden 
können, wird sich in den kommenden Jahren zeigen. Die technologischen Fort- 
schritte überholen sich gerade, die Nachfrage aus möglichen Anwendungen ist 
enorm. Die Themen Machine Learning (ML) und Deep Learning (DL) standen 2017 in 
Gartners Hype Cycle (Columbus 2017) auf dem höchsten Punkt, der für aufgebla- 
sene Erwartungen an diese Technologie steht. Der Antwort auf die Frage, wie nahe 
eine Übersetzung durch eine Künstliche Intelligenz der natürlichen Sprache kommen 
kann, werden uns die nächsten Jahre also zumindest etwas näher bringen. 


Evaluation 


Um eine definitive Aussage darüber treffen zu können, welcher Algorithmus die besse- 
ren Ergebnisse liefert, muss die Übersetzungsqualität objektiv gemessen werden. Das 
ist insbesondere wichtig, um die Parametereinstellungen vorhandener Algorithmen 
optimieren beziehungsweise weiterentwickeln zu können. Wird in anderem Kontext 
ein KI-System z. B. trainiert, Straßenschilder in Videoströmen zu finden, lässt sich leicht 
überprüfen, wie viele Schilder richtig als solche identifiziert und wie viele übersehen 
wurden. Die quantitative Bewertung der Qualität einer automatischen Sprachüberset- 
zung ist jedoch selbst Gegenstand wissenschaftlicher Debatten. Wie die „beste“ Über- 
setzung eines Satzes lautet, ist subjektiv, es gibt oft mehrere inhaltlich und grammati- 
kalisch korrekte Versionen. Ein automatisierter, objektiver Vergleich mit einer subjekti- 
ven Referenzübersetzung wird nie eine absolute Aussagekraft haben. 


Eine weit verbreitete Metrik ist das BLEU-System (Papineni et al. 2002). Grundidee 
hier ist zu vergleichen, wie viele Wörter aus der automatischen Übersetzung auch in 
einer humanen Referenzübersetzung nahe zusammen vorkommen. Grammatik und 
Syntax werden nicht evaluiert. Schwächen dieser Metrik lassen sich am einfachsten 
an einem Extrembeispiel demonstrieren. Den englischen Satz „The food in prison 
was horrible.” übersetzt Google Translate korrekt mit „Das Essen im Gefängnis war 
schrecklich”. Lautet der deutsche Referenzsatz, mit dem die Übersetzung für die 
Bewertung verglichen wird, aber „Die Nahrung in der Haftanstalt war fürchterlich.”, 
wird der BLEU-Wert miserabel ausfallen, da einzig das Wort „war” identisch ist. Die 
Metrik kann wegen solcher Unzulänglichkeiten nicht zur Evaluierung eines einzelnen 
Satzes genutzt werden, sondern muss über längere Texte gemittelt werden. 


Mit der Veröffentlichung des NMT-Systems gab Google an, für die Übersetzung eines 
häufig verwendeten Referenztexts (WMF' 14) vom Englischen ins Französische einen 
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ENGLISCH-SPANISCH SPANISCH-ENGLISCH 


HUMAN- HUMAN- 
ÜBERSETZUNG | ÜBERSETZUNG 
5,504 | 5,372 


Abbildung 10.3: Die betrachtete SMT ist der phrasenbasierte Algorithmus „Google Translate” 
und die NMT der neuronale Algorithmus „Google Neural Machine Translation (GNMT)“. Die 
Humanübersetzung wurde durch bilinguale Menschen erstellt. Die Zahlenwerte geben die 
Bewertung der jeweiligen Übersetzung durch menschliche Prüfer an (0 = schlecht, 6 = 
perfekt). 


BLEU-Wert von 38.95 (aus O bis 100) zu erreichen und für die Übersetzung vom 
Englischen ins Deutsche 24,17 BLEU (Wu et al. 2016). DeepL gibt an, auf den glei- 
chen Testdaten 44,7 für Englisch-Französisch und 31,1 BLEU für Englisch-Deutsch zu 
erreichen. Kritiker der BLEU-Metrik bemerken jedoch, dass durch die Schwächen des 
Messverfahrens Änderungen um wenige Punkte nicht aussagekräftig sind (Pan 
2016). 


Zusätzlich zur BLEU-Evaluierung ließ Google im Rahmen der gleichen Veröffentli- 
chung menschliche Prüfer drei Versionen einer Übersetzung bewerten: SMT, NMT 
und Human. Die Prüfer vergaben O bis sechs Punkte für die Qualität der Überset- 
zung. Abbildung 10.3 zeigt das Ergebnis und die Verbesserung der Qualität durch 
das neuronale Netz. Doch allein die Tatsache, dass selbst die Humanübersetzung 
nicht die volle Punktzahl erreichte, zeigt, wie subjektiv eine Qualitätsbewertung ist. 


Der Hersteller von Übersetzungssoftware Omniscien Technologies weist in einem 
White Paper außerdem darauf hin, dass die Qualität der Übersetzung sehr stark von 
verschiedenen Randbedingungen abhängt. Neben dem gewählten Algorithmus spie- 
len auch die Trainingsdaten (Qualität, Umfang, spezifische Domänen), das konkrete 
Sprachenpaar und die Art des Textes (technisch, formal, umgangssprachlich) wie 
auch die Zieldomäne und konkrete Anwendung eine wichtige Rolle. 
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Textfundus und Zero Shot Translation 


Ein kritischer Faktor für die Qualität einer Übersetzung ist der Textfundus, mit dem 
der selbstlernende Algorithmus trainiert wird. Traditionell wurden hier Dokumente 
aus dem Umfeld der UN oder der EU herangezogen, die professionelle Übersetzer in 
zahlreichen Sprachen parallel erstellen und die frei verfügbar sind. Bücher, die in 
mehrere Sprachen übersetzt wurden, sind typischerweise nicht im großen Umfang 
frei zugänglich. Der Anbieter DeepL gründet seinen Erfolg unter anderem darauf, 
dass er aus seiner Unternehmensvorgeschichte Zugriff auf Milliarden qualitativ hoch- 
wertiger Übersetzungen hat. Die großen Anbieter, die bestimmte kommerzielle 
Domänen adressieren, heben sich vor allem auch durch das jeweilige domänenspezi- 
fische Trainingsmaterial voneinander ab. Unter den Generalübersetzern hat z. B. 
Google durch seinen Zugriff auf riesige Datenmengen in verschiedenen Sprachen 
einen Vorteil gegenüber Wettbewerbern. Da diese Daten jedoch nicht zwingend 
verifiziert und von guter Qualität sind, kann ein geringerer Datenumfang die gleiche 
oder sogar bessere Übersetzungsqualität liefern, solange die Güte der Trainingsdaten 
zuverlässig hoch ist. 


Einen von vielen interessanten, im Zusammenhang mit der Auswahl des Textfundus 
auftretenden Effekten beschrieb Nataly Kelly, Vice President bei Smartling: „Given 
that male pronouns have been over-represented throughout history in most langua- 
ges and cultures, machine translation tends to reflect this historical gender bias.” 
(Errens) (Übersetzung mit DeepL: „Da männliche Pronomen in der Geschichte in den 
meisten Sprachen und Kulturen überrepräsentiert waren, spiegelt die maschinelle 
Übersetzung diese historische geschlechtsspezifische Ausrichtung wider.”). So kann 
es etwa passieren, dass das englische „engineer” unabhängig vom Kontext eher mit 
Ingenieur als mit Ingenieurin übersetzt wird. 


Wenn nur beschränkt viel Textmaterial verfügbar ist, zeigt sich eine weitere Stärke 
der NMT. So können z. B. prinzipiell auch einsprachige Texte zum Lernfortschritt bei- 
tragen, da hieraus auch Sprachstruktur einer einzelnen Sprache und begünstigte 
Wortkombinationen entnommen werden können. Die Verbesserung der Lernpro- 
zesse, insbesondere unter Einbeziehung von monolingualem Trainingsmaterial ist 
derzeit denn auch ein zentraler Entwicklungspunkt. Das ist besonders für diejenigen 
Sprachenpaare relevant, für die keine oder nur wenige gemeinsame, bilinguale Texte 
vorliegen. 


In genau diesen Fällen erweist sich die NMT der SMT durch ein weiteres Potenzial als 
überlegen: Sie bietet die Möglichkeit zur sogenannten Zero-Shot-Translation. Gibt es 
etwa für das Sprachenpaar Finnisch-Afrikaans nicht genügend zweisprachiges Trai- 
ningsmaterial, muss mit dem SMT-Verfahren eine Zwischensprache genutzt werden, 
mit der es jeweils bilinguale Texte gibt, die parallel statistisch ausgewertet werden 
können („Pivot-Translation”). So muss erst vom Finnischen z. B. ins Englische und im 
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Anschluss vom Englischen in Afrikaans übersetzt werden. In diesem Prozess akkumu- 
lieren sich Übersetzungsfehler drastisch und die Ausgabe in der Zielsprache ist zum 
Teil kaum mehr verständlich. Ein neuronales Netz hingegen kann prinzipiell gleichzei- 
tig mit allen Trainingsdaten mehrerer Sprachen gefüttert werden (Johnson et al. 2017) 
und direkt Verbindungen über mehrere Sprachen hinweg aufbauen. Wenn keine 
direkte Verbindung zwischen zwei Sprachen besteht, kann über Logikketten eine 
Übersetzung von anderen Sprachenpaaren abgeleitet werden, die relevante Informa- 
tionen beinhalten (Abbildung 10.4). In der Realität werden derzeit jedoch viele neuro- 
nale Systeme für konkrete Sprachenpaare konfiguriert und trainiert. Die Zero-Shot 
Translation steht erst am Anfang der Entwicklungen und wird zu weiteren Verbesse- 
rungen in der Übersetzungsqualität bei allen Sprachpaaren beitragen. 


PIVOT f ZERO-SHOT 


Deutsch 
Übersetzung mit Finnisch-Englisch- 


spezifischem Algorithmus : Finnisch Griechisch 
Italienisch Italienisch 
Schwedisch Africaans 
Englisch 
Übersetzung mit Englisch-Afrikaans- i Übersetzung mit mehrsprachigem 
spezifischem Algorithmus - Algorithmus 


AFRIKAANS : AFRIKAANS 


Abbildung 10.4: Bisher musste für Sprachpaare, die nicht über ausreichend viele gemein- 
same Textquellen verfügen, eine sogenannte „Pivot-Translation” über eine gemeinsame 
Zwischensprache durchgeführt werden. Ein NMT-Algorithmus hingegen kann prinzipiell 
gleichzeitig mit allen Trainingsdaten mehrerer Sprachen gefüttert werden und direkt 
Verbindungen über mehrere Sprachen hinweg aufbauen - per „Zero-Shot- Translation“ 
(eigene Darstellung angelehnt an Lommel 2017). 
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Insgesamt ist der Einfluss des Trainingsmaterials und des Trainingsprozesses auf die 
Übersetzungsqualität enorm. Die Verfügbarkeit von geeignetem, hochwertigem Trai- 
ningsmaterial wird zukünftig entscheidend sein, um die Vision einer natürlichen, 
zuverlässigen Sprachübersetzung zu erreichen. 


Sprachenerweiterung und „Low-Resource languages” 


Google bot im Februar 2018 die Möglichkeit, 103 Sprachen zu übersetzen, wobei 
noch nicht alle Sprachenpaare die NMT nutzen können, sondern mit dem SMT-Algo- 
rithmus auskommen müssen. DeepL unterstützte sieben Sprachen. Auf der Welt gibt 
es etwa 6.900 verschiedene Sprachen. Google deckt davon also weniger als 2 Pro- 
zent ab. Fast das gesamte Wissen liegt in ca. 1 Prozent der Sprachen vor (Carbonell 
2016). 


Um das volle Potenzial des Internets für einen gerechten, barrierefreien Zugang zu 
Wissen und Informationen ausschöpfen zu können, muss sichergestellt werden, dass 
auch die Sprachbarriere fällt. Und zwar nicht nur für die 77 Sprachen, die mehr als 
zehn Millionen Menschen jeweils sprechen, sondern auch und gerade für diejenigen 
Sprachen, in denen sich nur kleine Gruppen verständigen. Für diese Sprachen steht 
oft nur wenig Trainingsmaterial für die maschinelle Übersetzung zur Verfügung 
(„Low-resource languages”). Allein in Indien gibt es bis zu 400 linguistisch unter- 
schiedliche Sprachen und selbst dort, in der ehemaligen britischen Kolonie, die Eng- 
lisch als eine offizielle Amtssprache besitzt, ist es bei weitem keine Selbstverständlich- 
keit, dass Englisch - die Sprache des Internets - verstanden wird. Auch Soldaten oder 
internationale Hilfsorganisationen in Krisengebieten treffen häufig auf Vertreter der 
„Low-resource-languages” und könnten von maschinellen Übersetzern profitieren. 
„Low-resource-languages” und das Auffinden von nutzbarem Textmaterial für diese 
Sprachen stehen daher auch regelmäßig im Fokus der Ideenschmiede des US-Vertei- 
digungsministeriums DARPA. 


Grundsätzlich übersetzen derzeit SMT-Algorithmen „Low-resource languages” bes- 
ser, da diese mit weniger Trainingsmaterial bessere Ergebnisse liefern als datenhung- 
rige neuronale Netze. Gleichzeitig sind gerade für diese Sprachen erst recht keine 
zweisprachigen Texte in beliebigen Zielsprachen vorhanden. Ein sprachenunspezifi- 
scher NMT-Algorithmus, der mit allen verfügbaren Sprachen gleichzeitig trainiert 
wird, Zero-Shot-Translation ermöglicht und gegebenenfalls durch einsprachiges Trai- 
ningsmaterial unterstützt werden kann, birgt hier großes Leistungspotenzial. 


Integration 


Die Vision, die Douglas Adams’ Babelfisch verkörpert, geht deutlich über das reine 
Übersetzen von Texten hinaus. Nachdem der Reisende den Babelfisch ins Ohr gesteckt 
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hat, kann er die Problematik „Sprache” komplett ausblenden und sich auf seine 
Handlungen konzentrieren. Als ein englischsprachiger Google-Manager und seine 
schwedische Kollegin sich im Herbst 2017 bei einer Presseveranstaltung Googles 
neue In-Ear-Kopfhörer ins Ohr steckten und begannen, sich miteinander in ihrer 
jeweiligen Sprache zu unterhalten, lag in den Medien der Vergleich mit dem Babel- 
fisch nahe. Was tatsächlich passierte, war, dass die Bluetooth-Kopfhörer mit einem 
Smartphone verbunden waren, auf dem die App Google Translate lief. Die App über- 
trug über den Cloud-Service die gesprochene englische Sprache in englischen Text, 
übersetzte diesen ins Schwedische und verwandelte den schwedischen Text wieder 
in eine schwedische Sprachausgabe. Weil das drahtlose Netzwerk bei der Presskon- 
ferenz offensichtlich eine hohe Datenrate unterstützte, konnte das Ganze fast in 
Echtzeit geschehen. 


Damit wir die Sprachbarriere tatsächlich ignorieren können, muss die Übersetzung 
vollständig in unsere Umgebung integriert werden. Im ausschließlich textlich digita- 
len Umfeld ist das bereits gut umgesetzt. Google Translate kann mittlerweile in jeder 
anderen App genutzt werden, Webseiten können aus der Suchergebnisliste direkt in 
der automatisch übersetzten Version aufgerufen werden, Facebook zeigt Neuigkei- 
ten auf Wunsch direkt zusammen mit der Übersetzung an. Sprache-zu-Sprache- 
Übersetzungsdienste hingegen gibt es zwar - neben Google bietet dies zum Beispiel 
auch Microsoft im Skype Translator an - die derzeitige Qualität lässt jedoch zu wün- 
schen übrig. Das maschinelle Verstehen von gesprochener Sprache ist eine immense 
Herausforderung und auch nur durch das exzessive Training einer Künstlichen Intelli- 
genz mit einer riesigen Datenmenge zu erreichen. Ob individuelle Stimmlagen, Dia- 
lekte, Akzente, Sprachfehler, undeutliche Aussprache oder Hintergrundgeräusche: 
die vielfältigen akustischen Variationen machen das Training eines Spracherken- 
nungsalgorithmus zu einer Herkulesaufgabe. In der Verkettung der Spracherken- 
nung mit einem Übersetzungsprogramm, das mit unsauberen Formulierungen, 
unvollständigen Sätzen, Slang und Umgangsvokabular noch einmal besonders her- 
ausgefordert wird, addieren sich die Fehler. 


Trotz dieser nachvollziehbaren Herausforderungen funktionieren die existierenden 
Apps in überschaubaren Alltagssituation überraschend gut und lassen gespannt auf 
die Entwicklungen der nächsten Jahre blicken. Allein das kontinuierliche Anwachsen 
der Datenbasis, z. B. von Google, trainiert die Künstliche Intelligenz ständig weiter, 
sodass sogar ohne sonstiges Zutun immer mehr Sprachnuancen unterschieden und 
erkannt werden können. 


Im Jahr 2006 urteilte die britische Wochenzeitung Economist mit Recht: „Translation 
systems are of limited use if they cannot be used by people on the move” (Überset- 
zung mit DeepL: „Übersetzungssysteme sind nur begrenzt nutzbar, wenn sie von 
Personen, die unterwegs sind, nicht genutzt werden können.”; The Economist 2006). 
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Dem sind wir mit Apps wie Google Translate, für die im Übrigen auch ein Offline- 
Modus zur Verfügung steht und mit denen auch Text aus Bildern übersetzt werden 
kann, schon deutlich näher gekommen, ein Babelfish ist es aber noch nicht. 


Ausblick 


Will man sich aktuell zum Thema maschinelle Übersetzung schlau machen, muss 
man penibel das Erstellungsdatum der Informationsquelle berücksichtigen. Aussa- 
gen, die vor weniger als zwei Jahren richtig waren, sind mit Einführung der NMT ab 
Ende 2016 bereits überholt, und die Entwicklungsgeschwindigkeit scheint nicht 
abzunehmen. Durch die massiven Investitionen großer Konzerne wie Google, Ama- 
zon, Microsoft in die Forschung zum Deep Learning und Maschinenlernen werden 
kontinuierlich Fortschritte erzielt (Columbus 2017). Bis zum Jahr 2016 war die 
gesamte Übersetzungsbranche zu einer 40-Milliarden-USD-Industrie angewachsen 
mit einem jährlichen Wachstum von 7 Prozent. Der Unterbereich der maschinellen 
Übersetzung ist hingegen sogar um 20 bis 25 Prozent gewachsen (Vogel 2016). 


Parallel zu den Entwicklungen in der reinen Sprachübersetzung wachsen die Ausprä- 
gungen und Anwendungsfelder von Kl stetig an. Die Abhängigkeit von Qualität und 
Umfang der Trainingsdaten, das mangelnde Verständnis für den Kontext und die 
fehlende Alltagserfahrung sind Probleme, die über die verschiedenen Anwendungen 
hinweg immer wieder auftauchen. Lösungen können sich gegenseitig befruchten, 
wie auch DeepL erfolgreich die Ansätze aus der Bilderkennung auf die Sprachüber- 
setzung übertragen hat. 


Für eine zuverlässig fehlerfreie Übersetzung benötigen Computer semantisches Wis- 
sen: Gebäude haben Dächer, Türen können sich öffnen und schließen, Autos können 
fahren, Flugzeuge fliegen in der Luft.... Das gleiche Wissen, das eine Übersetzung 
erleichtert und prinzipiell in Datenbanken vorgehalten werden kann, vermag auch 
einen Algorithmus bei der Bilderkennung oder beim Interpretieren gesprochener 
Sprache zu unterstützen. Für die richtige Interpretation einer Aussage und damit eine 
zweifelsfreie Übersetzung ist aber über solche einfachen Zusammenhänge hinaus 
noch zusätzliches empirisches Wissen nötig. In den folgenden beiden Beispielsätzen 
bezieht sich „sie“ einmal auf die Stadtverwaltung und einmal auf die Demonstran- 
ten. Ohne ein komplexeres Hintergrundwissen über Stadtverwaltungen, Demonstra- 
toren und Politik kann aber mit keinem Regelsatz dieser Zusammenhang hergestellt 
werden (angelehnt an Hobbs 1976). 


Die Stadträte verweigerten den Demonstranten eine Erlaubnis, weil sie Gewalt fürch- 
teten. 


Die Stadträte verweigerten den Demonstranten eine Erlaubnis, weil sie Gewalt befür- 
worteten. 


208 B Anwendung 


Ob eine solche sprachliche Ambiguität in ferner Zukunft automatisiert aufgelöst wer- 
den kann, vielleicht durch einen immer größeren Datenschatz und die Kombination 
unterschiedlicher Kl-Anwendungen, ist abzuwarten. Vielleicht kann das aber auch 
erst durch den aktiv agierenden und interagierenden Roboter geschehen, der dann 
wirklich direkt im Alltag lernen kann. Bis dahin werden die Entwicklungen aber einem 
Babelfisch zunehmend nahe kommen und Sprachbarrieren können weiter abneh- 
men. 
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Einleitung: „Intelligenz ist nicht das Privileg 
von Auserwählten.” 


Marc Bovenschulte, Julian Stubbe 


Im Jahr 1987 formulierte Victor Serebriakoff, britischer Autor und ehemaliger 
Präsident der Gesellschaft für Menschen mit hohem IQ „Mensa”, bei seiner 
Reflexion über die biologische und die - zu diesem Zeitpunkt noch recht über- 
schaubare - Kl, dass Intelligenz stets ihre eigene Vervollkommnung anstrebe. 
Serebriakoff betrachtete den Menschen dabei nicht als eine Spezies von Aus- 
erwählten, der das Recht vorbehalten sei, intelligent zu sein gegenüber einer 
profanen, nicht-intelligenten Umwelt. Vielmehr verstand er Intelligenz als 
etwas Universelles, das sich über unterschiedliche Substrate hinweg infolge 
von neuen, sich stetig verändernden Informationen optimiert. So gesehen 
lässt sich die Evolution des Lebens auch als eine der Intelligenz verstehen. Sie 
strebt an, sich unabhängig vom Lebewesen oder vom materiellen Substrat 
weiterzuentwickeln. Nach Serebriakoff ist es nur logisch, dass die Intelligenz 
eine Erweiterung ihrer Fähigkeiten durch Erweiterung ihrer materiellen Basis 
sucht - also vom Neuron zum Chip. Die KI ist damit unter Umständen eine 
Erweiterung oder Fortsetzung der natürlichen Intelligenz, sie stellt keine Kon- 
kurrenz und damit auch nicht per se eine Bedrohung dar. 


Serebriakoffs Perspektive lädt ein, das Verhältnis von KI und Gesellschaft neu zu 
überdenken. Sie lehnt es ab, Kategorien als Dichotomie zu behandeln, als zwei 
getrennte Sphären, die nur vereinzelt aufeinander treffen, also etwa „die Gesell- 
schaft hier“ und „die Technologie dort”. Im Gegenteil: Nach seiner Auffassung sind 
Innovationen, Neuerungen oder Wandlungen als Kontinuum zu betrachten, sowohl 
zeitlich als auch im Hinblick auf aktuelle Zusammenhänge zwischen Gesellschaft, 
Politik, Wissenschaft und Technik. Alle diese Bereiche entwickeln sich sowohl auf 
Pfaden, die von einer gewissen Eigendynamik geprägt sind, als auch in stetiger 
Wechselbeziehung zueinander. Veränderungen und Disruptionen, also Zerrüttungen 
von gegebenen Strukturen, erscheinen aus dieser Sicht nicht als gleichsam kosmische 
Ereignisse, sondern sind vielmehr, wie in der biologischen Evolution, Ergebnisse kon- 
tinuierlicher Mutation und Selektion. Durch diese entsteht Neues, einzelne Innovati- 
onen setzen sich durch und werden als funktionierende Technik zur Grundlage für 
Folgeinnovationen. 


Des Weiteren lehrt er uns etwas über die Beziehung des Menschen - in seiner Natur 
als reflexives Wesen - zur KI, und das insbesondere im Hinblick auf die Bedeutung 
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von „Intelligenz“. In der Diskussion über lernende und selbstständig handelnde 
Maschinen wird Intelligenz oftmals als zutiefst menschliche Eigenschaft beschrieben. 
Der Einbruch technischer Artefakte in diese Domäne hat noch immer etwas Unerhör- 
tes, das das menschliche Selbstverständnis in Frage stellt. Wenn der Mensch die 
Krone der Schöpfung ist, muss er selbstverständlich auch die Krone der Intelligenz 
sein. Dabei zeigt sich, dass es der Mensch aufgrund seiner Entstehungsgeschichte 
gewohnt ist, sich zu anderen intelligenten Wesen zu verhalten. So sind bestimmte 
Lebewesen dem Menschen in spezifischen neuronalen Aufgaben, z. B. der Verarbei- 
tung visueller Reize, ebenbürtig oder sogar überlegen. Und jede dieser Formen der 
Intelligenz hat ihre Daseinsberechtigung und verschwindet nicht angesichts einer 
höheren Entwicklungsstufe. Es existiert ein kontinuierlicher Wandel, der von horizon- 
taler und vertikaler Vielfalt und Ko-Existenz geprägt ist. Der Mensch schafft sich 
somit auch durch die „Entfesselung der KI” nicht selber ab, sondern verändert sich, 
wie er es bereits während seines gesamten Daseins im Wechselverhältnis mit seiner 
Umwelt getan hat. Die Intelligenz wandelt sich ebenfalls, sie wechselt das Substrat 
von in vivo zu in silica, von Analytik zur Kreativität und so weiter. 


So inspirierend dieser Ansatz auch ist, so stößt er hinsichtlich der Analyse von KI und 
Gesellschaft auch an Grenzen. Soziale Fragestellungen, wie diejenigen nach Macht- 
verhältnissen unter den unterschiedlichen Akteuren innerhalb des Innovationsge- 
schehens KI, fallen unter den Tisch. Für eine analytische Beschreibung der Beziehun- 
gen zwischen Mensch und Kl reicht das Vokabular dieser von der Biologie und ihren 
Evolutionsprinzipien inspirierten Perspektive nicht. Zudem verleitet diese Sichtweise 
auch zu einem gewissen Fatalismus, der die Geschichte der Kl sich selbst überlassen 
würde. Wann immer die Rolle der Kl in der Gesellschaft, in der Arbeitswelt etc. the- 
matisiert wird, ist ein Vergleich mit der Einzigartigkeit des Menschen nicht fern. Tat- 
sächlich jedoch ist die meiste KI bei alltäglichen Aufgaben - ohne ihren Wert in 
irgendeiner Weise mindern zu wollen - viele Stufen darunter angesiedelt. Es handelt 
sich um kleine, beschränkte Aufgaben („tasks“), die keine Singularität, also ein tech- 
nisches System mit Bewusstsein, benötigen und folglich auch gar nicht darauf abzie- 
len, eine solche zu entwickeln. Es geht vielmehr um ein „Mitdenken” bei diesen 
Aufgaben - also darum, eine Aufgabenstellung zu erkennen, das Vorher und Nach- 
her vorausschauend zu vergleichen, sowie Lösungsmöglichkeiten wie Werkzeuge 
und Material oder eigene Fähigkeiten, zu überprüfen. Der Anspruch, der universellen 
Intelligenz des Menschen zu gleichen, wird dabei mit hoher Wahrscheinlichkeit eher 
selten gefordert sein. Intelligente Maschinen müssen vielmehr Bauteile richtig aus- 
wählen und platzieren, Systemparameter in Abhängigkeit von internen und externen 
Einflussfaktoren einstellen und Situationen anhand von Indikatoren wie Verkehr oder 
Krankheiten erfassen können. Gegenwärtig besteht also weniger die Gefahr, dass 
uns die Kl in den kommenden Jahren überfordert und überflügelt, sondern vielmehr 
darin, dass wir unerfüllbare Erwartungen an die technischen Systeme haben. 
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Die Beiträge in diesem Teil tragen der Vielseitigkeit des Innovationsphänomens KI 
Rechnung, weil ihre analytischen Ansätze ähnlich vielfältig sind. Gemeinsam ist ihnen 
der Fokus auf die Wechselbeziehungen zwischen Gesellschaft, Wirtschaft, Politik 
und Technologie. Sie richten den Blick auf die sozialen Arenen, in denen das Innova- 
tionspotenzial von KI ausgehandelt wird, darauf, wer an diesen Prozessen beteiligt ist 
und welche sozialen und technischen Pfadabhängigkeiten existieren. Sie entwerfen 
Szenarien, wie in der Gesellschaft KI gestaltet werden kann und unter welchen 
Bedingungen KI demokratisch akzeptabel ist. 


In der Beschreibung der Mikro-Konstellationen sehen die Autoren der Beiträge genau 
wie Serebriakoff Mensch und Technik nicht als isolierte Sphären. In der Gesamtschau 
treten drei Muster hervor, die auf gesellschaftlicher Ebene die Beziehungen zwischen 
Menschen und KI charakterisieren. Diese Muster sind nicht trennscharf, sondern 
bauen aufeinander auf. 


Erstes Muster: Kl ist ein Bestandteil der Gesellschaft. 


Diese Aussage ist eine grundsätzliche Diagnose und impliziert eine analytische Hal- 
tung: Gesellschaft und KI können nicht als zwei entkoppelte Sphären gedacht wer- 
den. Kl ist keine Innovation, die in einem geschlossenen Labor entwickelt und nach 
Vollendung freigelassen wird, um dort auf die Gesellschaft zu treffen. Die Innovation 
„KI“ folgt vielmehr der Logik eines „Realexperiments”, in dem eine Technologie, 
ohne ausgereift zu sein und ohne ihre Implikationen vorab bestimmt zu haben, ange- 
wandt wird. Der Sinn und Zweck von KI ergibt sich erst durch ihren Gebrauch, wenn 
sie mit sozialen Praktiken, gesellschaftlichen Werten und Lebenswelten gekoppelt 
wird. 


Wir sind in einem Stadium angelangt, in dem sich Gesellschaft und KI nicht mehr 
unabhängig voneinander entfalten. Neue soziale Muster entstehen durch die Ver- 
schränkung gesellschaftlicher und technologischer Entwicklungen. Die empirischen 
Beispiele der Beiträge dieses Teils zeigen, dass KI ein prägender Bestandteil der 
Gesellschaft ist. Sie gehört zu unserem Alltag und wirkt darauf ein, wie wir arbeiten 
und miteinander kommunizieren. Ein Beispiel ist der Einsatz von KI in sozialen 
Medien: Algorithmisch sortierte Informationen beeinflussen politische Wahlen, und 
gleichzeitig verschafft soziale Kommunikation im Internet der KI ein wesentliches 
Feld für Innovationen. Der Beitrag 13 legt dar, wie Kl im Rahmen von kreativer Arbeit 
selbst zum Ko-Schöpfer neuer Gegenstände und Medien wird. Hier rückt KI ver- 
meintlich stark in das Hoheitsgebiet des Menschen vor, relevant wird sie jedoch erst, 
indem sie die gesellschaftliche Wertschätzung von Neuheit und Ästhetik nährt. Es ist 
somit durchaus nicht trivial festzustellen, dass KI integraler Bestandteil von Gesell- 
schaft ist. 
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Zweites Muster: Kl ist eine Herausforderung für die Gesellschaft. 


Wenn KI Bestandteil von Gesellschaft ist, kann diese mit ihr auch verändert werden, 
und zwar im Guten wie im Schlechten. Das macht KI zu einer großen gesellschaftli- 
chen Aufgabe, denn sie kann demokratische Werte unterstützen, aber sie auch 
untergraben. 


Die folgenden Beiträge geben Einblicke, wie sich diese Herausforderungen in einzel- 
nen Bereichen zeigen und wie verschiedene Akteure über Chancen und Risiken ver- 
handeln. Wenn es um Arbeit geht, werden die Möglichkeiten und Gefahren beson- 
ders stark und kontrovers diskutiert. Einerseits macht KI Arbeitsprozesse einfacher, 
flexibler und innovativer, andererseits drohen Arbeitsplatzverluste, die insbesondere 
die Mitte der Gesellschaft treffen würde. Die im Beitrag 11 angesprochene Polarisie- 
rungshypothese spitzt dies zu: KI wird das mittlere Qualifikationssegment automati- 
sieren, während dies für Jobs am unteren Ende des Qualifikationsniveaus zu teuer ist 
und Tätigkeiten am oberen Ende weiterhin nicht technisch ersetzt werden können. 
Bei kreativer Arbeit entsteht eine ähnliche Ambivalenz, denn KI wird zum kreativen 
Impulsgeber, einer vormals exklusiv menschlichen Rolle. 


Diese und weitere Beispiele zeigen, dass Menschen im Zusammenleben mit Kl ihre 
Rollen oftmals erst finden müssen. Menschen verschwinden nicht einfach, das lehrt 
uns spätestens Serebriakoffs Bild der Evolution, aber die Gesellschaft steht vor der 
Aufgabe, Mutation und Selektion aktiv zu gestalten und durch einen entsprechen- 
den Ausgleich dafür zu sorgen, dass sich kein naturgesetzliches „Survival oft he fit- 
test” herausbildet. 


Drittes Muster: Kl ist ein Spiegel der Gesellschaft. 


Die Einsicht, dass KI sowohl Bestandteil als auch Herausforderung von Gesellschaft 
ist, wirft oftmals mehr Fragen auf als Antworten bereitstehen. Einige davon gehen 
über den Sinn und Zweck spezifischer Kl-Anwendungen hinaus und betreffen das 
menschliche Selbstverständnis: Wie viel KI wollen wir? Und wieso ist es für den Men- 
schen überhaupt ein Problem, wenn es intelligentere Entitäten als ihn selbst gibt? Mit 
diesen Fragen wird KI zum Spiegel der Gesellschaft. 


Die Autoren der Kapitel zur Ethik der KI diskutieren diese und weitere Fragen. Sie 
zeigen, dass mit der Einführung von KI oftmals Entscheidungsprobleme einhergehen, 
in denen Richtig und Falsch nicht einfach zu erkennen sind, sondern ethisch reflek- 
tiert werden sollten. Dies betrifft z. B. den Umgang mit persönlichen Daten. Diese 
ermöglichen erst den Einsatz von Kl, aber das richtige Maß an Datenfreigabe ist nicht 
einfach festzustellen. Daraus ergibt sich die Frage, welche Persönlichkeitsmerkmale 
des Menschen durch den Prozess der Digitalisierung zu technischen Nennwerten 
werden. Ähnliches gilt für das Problem, wie viel Kontrolle an KI übertragen werden 
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darf: Wer trägt die Verantwortung für Entscheidungen? Was ist überhaupt Verant- 
wortung in einem komplexen soziotechnischen System? Dies betrifft das Individuum 
sowie die Gesellschaft als Ganzes. Im Umfeld von Arbeit ist es aufschlussreich zu 
wissen, wie sich individuelle Kontexte verändern, was überhaupt als „Wert“ mensch- 
licher Arbeit zählt und inwiefern KI die sogenannte Arbeitsgesellschaft zu einem 
überholten Modell macht. Wenn KI als Kampfansage an etablierte Berufsbilder wahr- 
genommen wird, kann man umgekehrt auch fragen, wieso Arbeitslosigkeit ein Pro- 
blem und nicht einen Erfolg darstellt - und ob der Fehler eher darin besteht, Arbeit 
weiterhin als konstituierenden Wert unserer Gesellschaft zu sehen. Ein ähnlicher 
Spiegel wird der Gesellschaft auch im Zuge künstlicher Kreativität (KK) vorgehalten, 
wenngleich aus anderer Richtung: Wenn Maschinen kreativ werden, tritt dann der 
Mensch eines seiner letzten Hoheitsgebiete an die Technik ab? Wieso ist das über- 
haupt problematisch? Verbirgt sich dahinter nicht ein sehr anthropozentrisches Welt- 
bild, mit dem Menschen als einzig schöpferischem Wesen? 


Nicht jedes der in den Beiträgen dieses Teils vorgestellten Beispiele kann in dieser 
Weise zu Grundsatzdiskussionen führen. Es wird jedoch deutlich, dass KI in ihrem 
Verhältnis zur Gesellschaft eine besondere Technologie ist. Ihre technische Funktio- 
nalität, die von bildhaften Vorstellungen des Menschseins geprägt ist, sowie ihr Ein- 
dringen in verschiedenste Gesellschaftsbereiche konfrontieren die Allgemeinheit nur 
allzu oft mit sich selbst. 


Dabei bleiben die Autorinnen und Autoren der Beiträge dieses Teils nicht bei der 
Analyse und Beschreibung der vielfältigen Beziehungen zwischen KI und Gesellschaft 
stehen. Vielmehr schauen sie voraus und leiten Möglichkeiten ab, wie Forschung, 
Entwicklung und Innovation sozial gestaltet werden können. Die Vorschläge spre- 
chen sowohl die öffentliche Regelung von KI im Hinblick auf Forschung und Anwen- 
dung an als auch die Wirtschaft bis hin zur einzelnen Person. 


Da die Digitalisierung auf dem Weg zu sein scheint, zu einer „Technoreligion” zu 
werden, und die KI in dieser der vorläufige heilige Gral ist, verspricht auch die KI 
gleichermaßen Verdammnis und Erlösung. Das Ganze erinnert ein wenig an jene 
Diskussion, die im Jahr 1996 mit dem Schaf „Dolly“ ihren Anfang nahm. Auch mit 
Blick auf das reproduktive Klonen standen die Zeichen der Debatte alsbald auf Apo- 
kalypse. Heute, rund 20 Jahre nach „Dolly“, haben sich die technischen Möglichkei- 
ten und mit ihnen die Erfolgsraten des Klonens verbessert. Jedoch hat gleichzeitig ein 
breiter Diskurs darüber stattgefunden (und dauert an), welches Leben unter welchen 
Voraussetzungen geklont werden darf. Bisher hat der Mensch nicht dazugehört. 
Natürlich ist der Vergleich zwischen KI und Klonen nur bedingt tauglich, denn das 
Erstellen von Quellcode und Algorithmen für eine KI ist etwas anderes als das Mani- 
pulieren von Zellen mit dem Ziel, dass sich diese zu einem vollständigen Menschen 
ausdifferenzieren. Aber dennoch verbindet beides die Frage nach der Einzigartigkeit 
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des Menschen: Beim Klonen in individueller Hinsicht, bei der KI mit Blick auf das 
eigene Selbstverständnis. Und da ein sich dynamisch optimierender Programmcode 
in vielerlei Hinsicht dem genetischen Code und seiner evolutiven Veränderung ähnelt, 
kommt abermals die von Serebriakoff ins Spiel gebrachte Weiterentwicklung von 
biologischer und künstlicher Intelligenz zum Tragen. Da der Mensch gleichermaßen 
Subjekt und Objekt in der Entwicklung der KI sein kann, stellt sich im Kern die Frage 
nach der gesellschaftlichen Verantwortung. Unabhängig vom Typ der handelnden 
Person - ob im öffentlichen oder wirtschaftlichen Raum, ob im Gesamtgefüge oder 
individuell - muss jeder im Rahmen des eigenen Gestaltungspielraums Verantwor- 
tung tragen. Und vielleicht wird künftig eine wie auch immer geartete Kl einer der zu 
beteiligenden Akteure in diesem Aushandlungsprozess sein. 


Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 International Lizenz 
http:/creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche die Nutzung, 
Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und 
Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß 
nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen 
vorgenommen wurden. 


Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der 
genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes 
ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz 
steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für 
die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen 
Rechteinhabers einzuholen. 
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11. KI und Arbeit - Chance und Risiko zugleich 


Wenke Apt, Kai Priesack 


Zwei Sichtweisen dominieren die aktuelle Diskussion um die Auswirkungen 
von Kl auf die Arbeit. Die einen gehen von massiven Verwerfungen auf dem 
Arbeitsmarkt durch weitreichende Verdrängung von Arbeitskräften durch den 
Einsatz von Kl aus. Für die anderen bietet das Zusammenspiel zwischen 
Mensch und KI vielseitige Chancen, um die Arbeit aufzuwerten und damit die 
Arbeitsqualität zu verbessern. Die beiden Szenarien stehen dabei nicht unbe- 
dingt in unmittelbarem Gegensatz zueinander. So zeigt die Vergangenheit, 
dass der technologische Wandel auf verschiedene Gruppen von Beschäftigten 
sehr unterschiedliche Auswirkungen hatte - teils positive, teils negative. Mit 
Blick auf die Zukunft stehen wir deshalb vor der Herausforderung, eine digi- 
tale Spaltung (Digital Divide) zwischen tech-affinen Insidern und tech-ableh- 
nenden Outsidern zu verhindern. Dabei stellt sich nicht nur die Frage, wo Kl in 
Zukunft menschliche Tätigkeiten ersetzen kann, sondern gleichzeitig gilt es, 
die Fähigkeiten des Menschen zu fördern und seine Rolle in der Arbeitswelt 
der Zukunft neu zu definieren. 


Während die Geburtsstunde der KI als eigenständige Forschungsdisziplin bereits 
Anfang der 1950er Jahre geschlagen haben soll, haben Kl-Anwendungen erst im 
Laufe des letzten Jahrzehnts die Forschungslabore verlassen und Eingang in private 
Haushalte und die Arbeitswelt gefunden. Insbesondere durch das zuletzt stark ver- 
besserte Sprach-, Text- und Bildverständnis können virtuelle (Sprach-)Assistenten bei 
der Beschaffung, Auswertung, Zusammenfassung und Übersetzung von Informatio- 
nen helfen (Eberl 2018). Dabei ist egal, ob es sich um medizinische Diagnosen, Pro- 
zessinformationen aus den unterschiedlichen Geschäftsbereichen eines Unterneh- 
mens, Bewerbungen für einen bestimmten Arbeitsplatz oder Berichte aus Reparatur- 
werkstätten handelt. Computer verarbeiten große Datenmengen, um Muster zu 
erkennen und Vorhersagen zu treffen. Die Ergebnisse ähneln oft denen einer „Armee 
von Statistikern mit unbegrenzter Zeit und unbegrenzten Ressourcen”, nur „schnel- 
ler, günstiger und effizienter“ (Suich Bass 2018, S. 3). 


Die stetig wachsende Zahl an Bild-, Sprach-, Video- und Audiodateien dient Maschi- 
nen mit KI als wirksames Trainingsmaterial — mit jeder Aufgabenstellung lernen sie 
noch dazu (Eberl 2018). Im Gesundheitswesen herrscht beispielsweise die Hoffnung, 
dass sich Kl-Systeme „durch Gen-Datenbanken, Patientenakten, wissenschaftliche 
Studien und epidemische Statistiken fräsen, um Vorsorge, Forschung, Diagnose und 
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Therapie auf eine neue Stufe zu heben“ (Ramge 2018, S. 19). Dabei wird jedoch oft 
vergessen, dass insbesondere im Medizin- und Gesundheitsbereich die Hürden 
besonders hoch sind, um neuartige technische, datenbasierte Verfahren umzuset- 
zen. Durch ihre Fähigkeit zu erfassen, zu begreifen, zu handeln und zu lernen, kön- 
nen KI-Systeme jedoch viele Arbeitsprozesse, die auf Routine beruhen, automatisie- 
ren, effizienter machen und das Leistungsvermögen von Menschen in ihrem spezifi- 
schen Arbeitskontext erweitern. Dabei ermöglichen sie eine neue Art der 
Zusammenarbeit zwischen Mensch und Maschine, und bisher eher starre Geschäfts- 
prozesse haben durch KI die Möglichkeit, agiler und anpassungsfähiger zu werden. 
Durch diese neuartigen Mensch-Maschine-Teams wird auch die Arbeitsorganisation 
flexibler und durchlässiger (Daugherty und Wilson 2018). 


Starke und schwache KI 


Im Allgemeinen bezeichnet KI das Vorhaben, die Wahrnehmungen und das Handeln 
des Menschen durch Maschinen nachzubilden und somit menschenähnliche Intelli- 
genz zu schaffen. Dabei unterscheidet die Fachwelt zwischen schwacher und starker 
KI (Nilsson 2010, siehe Einleitung Teil A „Entwicklungswege zur KI”). Bei der schwa- 
chen KI lösen Algorithmen einzelne Aufgaben des Menschen, eine Intelligenz wird 
jedoch nur simuliert. Die starke KI beschreibt hingegen einen Zustand, bei dem 
Maschinen vergleichbare intellektuelle Fertigkeiten wie der Mensch haben und letzt- 
endlich über ein Bewusstsein ähnlich dem menschlichen verfügen. Allerdings handelt 
es sich dabei vornehmlich um ein visionär philosophisches Konzept, dessen Realisie- 
rung auf absehbare Zeit vielfach angezweifelt wird. Naheliegende Potenziale der KI 
lassen sich vielmehr in der Ergänzung und Erweiterung menschlicher Fähigkeiten 
erschließen (Daugherty und Wilson 2018). 


Mit Blick auf den aktuellen Stand der Technik fallen alle heute existierenden Ansätze 
in die Kategorie der „schwachen“ KI. Mithilfe datengetriebener Technologien und 
Konzepte bieten die bisher entwickelten Algorithmen intelligente Entscheidungen zu 
konkreten Anwendungsproblemen, sind jedoch noch weit davon entfernt, die Kom- 
plexität und universelle Einsetzbarkeit des Menschen zu erreichen. So handelt es sich 
bei den derzeit vorherrschenden Konzepten der KI - wie künstliche neuronale Netze 
(KNN), maschinelles Lernen (Machine Learning, ML) oder tiefes Lernen (Deep Lear- 
ning, DL) - um lernfähige Algorithmen, die essenziell von der Verfügbarkeit und 
Qualität der Daten abhängig sind und nur in Bereichen in Gebrauch sein können, die 
bereits umfassend von digitaler Datenverarbeitung durchdrungen sind. 


Wozu selbstlernende Systeme jedoch (noch) nicht in der Lage sind, sind Vernunft, 
Emotionalität, Empathie und Kreativität. Sie haben kein Verständnis für Zusammen- 
hänge und können nicht auf Hintergrundwissen zurückgreifen. Vielmehr sind sie 
„Meister im Vergleich von Mustern, nicht mehr” (Eberl 2018, S. 11). Ralf Herbrich, 
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Leiter der Kl-Forschung bei Amazon, sieht die größte Schwäche von Kl daher auch im 
fehlenden Bewusstsein: „Zu glauben, dass Künstliche Intelligenz eben intelligent ist, 
also über sich selbst nachdenken und Schlüsse ziehen, sich selber modifizieren und 
selbst Lernverfahren erfinden könnte - das ist heute nicht möglich und noch ein sehr 
offenes Forschungsgebiet“ (Lehmann 2018). Für die Zukunft gilt daher als „Formel“: 
Tätigkeiten, die vorausschauendes Denken und Kreativität erfordern, kaum repetitive 
Arbeitsschritte beinhalten und in einem sich stetig ändernden Arbeitsumfeld stattfin- 
den, werden sich auch „in 20 Jahren” noch nicht mittels KI automatisieren lassen 
(Wenzel 2018). Dazu zählen Tätigkeiten mit hohen Anforderungen an die emotio- 
nale und soziale Intelligenz, wie auch Aufgaben, die einen integrierenden Blick für 
das „große Ganze” erfordern, oder einfache körperliche Handlungen (z. B. Türen 
öffnen, Bälle fangen, laufen und Hindernissen ausweichen), die smarte Maschinen 
bzw. Roboter nur schwer ausführen können. Genau betrachtet fällt Kl-Systemen 
leicht, was dem Menschen schwerfällt - und umgekehrt. 


Darum mehren sich bereits Stimmen, die vor einer Überschätzung von KI warnen und 
vor allem auf drei Defizite der KI auf dem aktuellen Stand der Technik hinweisen, die 
in absehbarer Zeit nicht zu kompensieren sind (Wenzel 2018). Dazu zählen: erstens 
geringes Abstraktionsvermögen, insbesondere bei der Übertragung von Erfahrungen 
und gelerntem Wissen auf andere Kontexte, zweitens hohe Anforderungen an die 
Vorstrukturierung von Daten, Informationen und Umgebungen, sowie drittens man- 
gelhaftes Verstehen und Schlussfolgern im empathischen Sinne. Die Auswirkungen 
von KI auf Arbeit und Beschäftigung hängen weiterhin von technischen Fortschritten 
zur Verbesserung der Wahrnehmung und Feinmotorik, der kreativen Intelligenz und 
der sozialen Intelligenz ab (Dengler und Matthes 2015). Umfang und Geschwindig- 
keit der technologischen Entwicklung lassen sich dabei nur schwer abschätzen. Somit 
ist auch nicht absehbar, ob und wann diese technologischen Hindernisse bei der 
Übernahme manueller Nicht-Routine-Tätigkeiten überwunden werden. 


Vor diesem Hintergrund geht Eberl (2018, S. 14) davon aus, dass „eine Superintelli- 
genz, die uns Menschen auf allen Gebieten überflügelt, wohl eher in den Bereich der 
Science-Fiction als zu den realen Gefahren“ gehört. Wenzel (2018) sieht vor allem im 
Mangel eines funktionierenden Modells der Welt und des menschlichen „In-der- 
Welt-seins” die Ursache, warum die großen Durchbrüche der KI wohl noch weiter 
auf sich warten lassen müssen. Kl-Systemen fehle es einfach an Erfahrungen, impli- 
zitem Wissen, Urteilsfähigkeit, Empathie und Verbindlichkeit sowie sozialem Lernen 
und Emotionen, welche allesamt den Menschen und die menschliche Intelligenz aus- 
zeichnen. Aus diesem Grund sehen Daugherty und Wilson (2018) die größten 
Anwendungspotenziale von KI in der Symbiose von Mensch und Maschine. 
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Polarisierungsthese 


Um die Auswirkungen von KI auf den Arbeitsmarkt näher zu beleuchten, hilft ein 
Blick in die Wissenschaft. Eine von führenden Ökonomen vielfach vertretene These 
lautet, dass der technologische Wandel und die Digitalisierung zu einer Polarisierung 
des Arbeitsmarktes führen (Autor 2015; Dustmann et al. 2009; Goos et al. 2009; 
Spitz-Oener 2006). Demnach ist die Beschäftigung für Arbeiter in Berufen mit mitt- 
lerem Qualifikationsniveau relativ zur Beschäftigung von Arbeitskräften in Berufen 
mit niedrigem oder hohem Qualifikationsniveau in den letzten Jahrzehnten zurück- 
gegangen - eine Entwicklung, die sich auch mit Blick in die Zukunft fortsetzen soll. 
Begründet wird dieses Phänomen mit dem zunehmenden Einsatz digitaler Technolo- 
gien, die vorwiegend kognitiv und manuell repetitive und regelbasierte Aufgaben 
automatisieren bzw. übernehmen. Da der Anteil an Routineaufgaben in Berufen des 
mittleren Qualifikationsniveaus besonders groß war, sank entsprechend die Nach- 
frage nach Arbeitskräften auf diesen Gebieten, während Beschäftigte der niedrige- 
ren oder höheren Qualifikationsgruppen von einem steigenden Bedarf zur Erfüllung 
von nichtroutinemäßig ausführbaren manuellen und komplexen Aufgaben profitier- 
ten. Zuletzt haben Wissenschaftler der Organisation für wirtschaftliche Zusammen- 
arbeit und Entwicklung (OECD) gezeigt, dass die Polarisierung des Arbeitsmarkts in 
allen beobachteten OECD-Staaten in den letzten zwei Jahrzehnten zugenommen hat 
(OECD 2016). Dabei ist zu beachten, dass mit der Polarisierungsthese qualifikations- 
bezogene Verschiebungen am Arbeitsmarkt beschrieben werden, sich daraus aber 
nicht zwangsläufig Arbeitsplatzverluste ergeben. So ist in Deutschland trotz der rela- 
tiven Veränderung der Beschäftigung in Berufen mit unterschiedlichen Qualifikati- 
onsniveaus der Arbeitsmarkt insgesamt stabil geblieben; Arbeiter und Angestellte 
konnten also in anderen Professionen beschäftigt werden. Somit ergibt sich aus der 
Polarisierungshypothese die Frage, mit welchen Anpassungsprozessen Beschäftigte 
trotz einer zunehmenden Technisierung langfristig Anstellungen finden konnten. Das 
denkbare Spektrum ist breit und reicht von einer möglichen Dequalifizierung bis hin 
zum technologiegestütztem Upgrading (Hirsch-Kreinsen 2016). 


Wendet man sich den spezifischen Auswirkungen von KI zu, so ist im Hinblick auf die 
Polarisierungsthese ein Paradigmenwechsel denkbar. Nach einer Phase der Automa- 
tisierung, bei der Maschinen vor allem manuelle physische Routineaufgaben über- 
nahmen, konnten durch die anschließende Computerisierung auch kognitive Routi- 
netätigkeiten ersetzt werden, wobei dafür in den letzten Jahren zunehmend KI- 
Anwendungen herangezogen wurden. Von einer Substitution waren somit Berufe 
mit mittlerem Qualifikationsniveau betroffen, während in Berufen mit hohem Quali- 
fikationsniveau digitale Technologien komplementär zum Einsatz kamen. Dies könnte 
sich in Zukunft jedoch ändern. So geben derzeitige Kl-Anwendungen einen Ausblick 
darauf, wie die Technologie mehr und mehr in analytische und interaktive Arbeitsbe- 
reiche drängt, bei denen es darauf ankommt, komplexe Sachverhalte zu erfassen 
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und zu bewerten oder gar kreative Aufgaben zu lösen (Heinen et al. 2017; Dengler 
und Matthes 2018; Brynjolfsson und McAfee 2012). Mit KI könnte also langfristig 
der technologische Wandel eine „neue Stufe“ erreichen, die sich mit Blick auf die 
Arbeit deutlich von der bisherigen Automatisierung und Digitalisierung unterschei- 
det. Doch auch dabei stellt sich die Frage, ob dieser Prozess tatsächlich einen substi- 
tutiven Charakter hat und somit in Arbeitsplatzverluste zur Folge hat oder ob sich 
durch Kl-Anwendungen neue Chancen für einen komplementären Technologieein- 
satz bei der menschlichen Arbeit auftun. 


In Umfragen sind zumindest die US-Amerikaner weitgehend optimistisch über die 
Auswirkungen von KI: 76 Prozent der Befragten einer Gallup-Umfrage „stimmten 
zu” bzw. „stimmten voll und ganz zu”, dass Kl in den kommenden zehn Jahren 
einen grundlegenden Einfluss auf die Art und Weise haben wird, wie Menschen 
leben und arbeiten. Unter den Befragten, die diesen Wandel erwarten, haben wie- 
derrum 77 Prozent eine „weitgehend positive” bzw. „sehr positive“ Sicht auf die 
Veränderungen, die Kl in beiden Bereichen auslösen wird (Gallup Inc. 2018). Aller- 
dings erwartet mit 73 Prozent auch ein Großteil der Befragten einen Netto-Verlust 
von Arbeitsplätzen durch KI. Insbesondere Befragte aus Arbeiterberufen zeigten sich 
besorgt. Insgesamt erwarteten 82 Prozent von ihnen einen Netto-Stellenabbau - im 
Vergleich zu 71 Prozent der Angestellten (Gallup Inc. 2018). Unterdessen ist nur ein 
vergleichsweise kleiner Prozentsatz um den eigenen Posten besorgt: Lediglich 23 
Prozent der Berufstätigen sind „etwas besorgt” oder „sehr besorgt”, ihre Arbeit an 
neue Technologien zu verlieren. Die Angst vor einem Jobverlust ist dabei höher bei 
Befragten mit geringerem Bildungsstand (Gallup Inc. 2018). 


Die Ursache dafür könnte jedoch in einer „irrationalen Verweigerung” neuer Techno- 
logien liegen, die Suesskind und Suesskind (2015, S. 44) als „dogmatische Ableh- 
nung eines Systems” definieren, „mit dem der Skeptiker keine direkte persönliche 
Erfahrung hat.” Dabei wird typischerweise die Transferfähigkeit der betreffenden 
Technologien auf den eigenen Beruf angezweifelt. Kombiniert mit einer „technolo- 
gischen Kurzsichtigkeit” wird das Veränderungspotenzial zukünftiger Anwendungen 
unterschätzt, da als Referenz heutige Arbeitsweisen und aktuelle (Assistenz-) Techno- 
logien mit ihren entsprechenden Mängeln dienen. Dazu passt das „Gesetz” von Roy 
Amara („Amara’s Law”), das besagt: „Wir neigen dazu, kurzfristig den Effekt einer 
Technologie zu überschätzen und den Effekt auf lange Sicht zu unterschätzen” 
(Brooks 2017). 


Aktuelle Entwicklungen 


In Anknüpfung an die beschriebene Polarisierungs-Literatur, die vor allem eine rück- 
blickende Perspektive bietet, hat sich in den letzten Jahren ein weiterer Strang in der 
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Literatur etabliert, der den Blick in die Zukunft richtet und die Beschäftigungseffekte 
der fortschreitenden Digitalisierung prognostiziert (siehe Tabelle 11.1). 


Tabelle 11.1: Literaturübersicht zu potenziellen Beschäftigungseffekten 
(Quelle: eigene Darstellung in Ergänzung zu Heinen et al. (2017)). Die Spalte Gesamteffekte 
zeigt an, ob die Schätzung gesamtwirtschaftliche Effekte berücksichtigt. 


UNTERSUCHTE 
STUDIE REGION GESAMTEFFEKTE ZEITHORIZONT 
Frey und Osborne (2013)* USA Nein 
Bowles (2014) EU 
Bonin et al. (2015) Deutschland Nein 
Brzeski und Burk (2015) Deutschland Nein 
Dengler und Matthes (2015) Deutschland Nein 
Wolter et al. (2015) Deutschland Ja bis 2025 
Arntz et al. (2016) OECD Nein 
Vogler-Ludwig et al. (2016) Deutschland Ja bis 2030 
The World Bank Group (2016) 41 Länder und OECD Nein 
World Economic Forum (2016) 15 Länder/-gruppen Ja 2015 — 2020 
Berriman und Hawksworth (2017) Deutschland, Japan, Nein bis 2020 
USA, UK 
Manyika et al. (2017) 46 Länder Nein 
Dengler und Matthes (2018) Deutschland Nein 
Nedelkoska und Quintini (2018) OECD Nein 
Arntz et al. (2018) Deutschland Ja 2016 - 2021 


Zika et al. (2018) Deutschland Ja bis 2035 
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Die wohl bekannteste Studie stammt von Frey und Osborne (Frey und Osborne 2017 
2013). Mit ihrer Prognose, dass in den nächsten zwei Dekaden 47 Prozent der 
Beschäftigten in den USA einem hohen Substitutionsrisiko ausgesetzt sind, zeichne- 


Am stärksten gefährdete 


a BESCHÄFTIGUNGSSEGMENTE 


47% der Beschäftigung mit hohem Substitutionsrisiko in den Logistik; Bürokräfte; Produktion; Service; 
USA (>70% Substitutionsrisiko) Verkauf; Bau 


51% der Beschäftigung mit hohem Substitutionsrisiko in 
Deutschland nach Ansatz von Frey und Osborne 


42% der Beschäftigung mit hohem Substitutionsrisiko nach Bürofachkräfte; Montageberufe 
Ansatz von Frey und Osborne; 12% der Beschäftigung nach 
tätigkeitsbasiertem Ansatz 


59% der Arbeitsplätze bedroht Bürofachkräfte; Montageberufe 


15% der Beschäftigten mit sehr hohem Substituierbarkeitspo- Bürofachkräfte; Montageberufe 
tezial (>70% der Tätigkeiten heute schon ersetzbar) 


-60.000 Arbeitsplätze 


12% der Beschäftigung in Deutschland mit hohem Substituti- 
onsrisiko (nach tätigkeitsbasiertem Ansatz); 


+250.000 Arbeitsplätze Bürofachkräfte; Montageberufe 


55-85% der Beschäftigung anfällig für Automatisierung in 
OECD-Ländern 


+2% Beschäftigung durch technologische Entwicklung 
weltweit, dabei —1,56% durch KI 


35% der Beschäftigten mit hohem Automatisierungsrisiko in Logistik 
Deutschland 


48% Automatisierungspotenzial durch verfügbare Technologi- Produktion 
en in Deutschland 


25% der Beschäftigten mit sehr hohem Substituierbarkeitspo- Fertigungsberufe; Fertigungstechnische Berufe 
tenzial: (>70% der Tätigkeiten heute schon ersetzbar) 


23% der Beschäftigung in Deutschland mit hohem Automati- 
sierungsrisiko (>70% Automatisierungsrisiko) 


+1,8% Beschäftigungszuwachs Landwirtschaft; Bergbau; Gastgewerbe 


-60.000 Arbeitsplätze Fahrzeugbau; Sonstiges verarbeitendes Gewerbe 
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ten die beiden Autoren ein dramatisches Zukunftsbild für die Arbeit und stießen in 
den Medien auf ein großes Echo. In den Folgejahren griffen zahlreiche weitere Stu- 
dien das Thema erneut auf, indem sie entweder den Ansatz von Frey und Osborne 
auf andere Regionen übertrugen (Arntz et al. 2016; Bonin et al. 2015; Bowles 2014; 
Brzeski und Burk 2015) oder mit alternativen Methoden (z. B. tätigkeitsbasierter 
Ansatz) das Automatisierungspotenzial von Tätigkeiten abschätzten (Manyika et al. 
2017; Berriman und Hawksworth 2017; Dengler und Matthes 2015, 2018; The 
World Bank Group 2016; Bonin et al. 2015; Arntz et al. 2016; World Economic 
Forum 2016). 


Dabei reicht das Prognosespektrum für den Anteil der Beschäftigten mit „hohem“ 
Substitutionspotenzial — definiert durch ein Substitutionsrisiko von über 70 Prozent 
- aufgrund methodischer Unterschiede für Deutschland von 12 Prozent bis hin zu 
fast 60 Prozent. Quantifiziert wird mit diesen, teils alarmierenden Zahlen jedoch 
lediglich das technische Automatisierungspotenzial, welches nicht mit einer Umset- 
zung der Automatisierung gleichzusetzen ist (Bonin et al. 2015). Unberücksichtigt 
bleiben in diesen Prognosen die technologischen und betriebswirtschaftlichen Hür- 
den, die einer Ausschöpfung dieses theoretischen Potenzials entgegenstehen. Hier- 
auf haben kürzlich auch Frey und Osborne in einem Online-Beitrag hingewiesen und 
ergänzend angemerkt, dass sie in ihrem Papier aus dem Jahr 2013 bewusst keinen 
Zeithorizont für die Automatisierung benannt haben (Frey und Osborne 2018). 
Zuletzt bleiben dabei auch gesamtwirtschaftliche Effekte unberücksichtigt. So kann 
der technologische Wandel auch neue Arbeitsplätze schaffen, z. B. bei der Herstel- 
lung der neuen Technologien (Vogler-Ludwig 2017; Bonin et al. 2015). Um diese 
Prognoselücke zu schließen, wurde mithilfe von komplexen Szenario-Rechnungen 
der Versuch unternommen, die zukünftigen Wirkungen auf die Gesamtbeschäfti- 
gung unter Berücksichtigung der wichtigsten ökonomischen Einflussgrößen zu 
schätzen. Für Deutschland ergibt sich auch dabei kein klares Bild, so reichen die Pro- 
gnosen von leicht negativen bis hin zu deutlich positiven (Vogler-Ludwig et al. 2016; 
Wolter et al. 2015; Zika et al. 2018; Arntz et al. 2018). Darüber hinaus sind auch 
kritischen Stimmen zu nennen, die vielfach Methodik und Annahmen der Prognosen 
anzweifeln und die Aussagekraft der Studien grundsätzlich in Frage stellen (Heinen 
et al. 2017; Brooks 2017). 


Wenngleich sich die zahlreichen Prognose-Studien vorwiegend auf den allgemeinen 
Einfluss des technologischen Wandels beziehen, so stellen bereits Frey und Osborne 
einen deutlichen Bezug zur Kl her. Demnach sehen die beiden Autoren neben der 
Robotik im ML eine der wichtigsten technologischen Entwicklungen des 21. Jahr- 
hunderts. Getrieben durch die Verfügbarkeit von Big Data kann durch ML-Anwen- 
dungen ein breites Spektrum kognitiver, nicht routinemäßig ausgeführter Tätigkeiten 
automatisiert werden, während Entwicklungen in der Robotik im wachsenden 
Umfang manuelle Aufgaben unterstützen können (Frey und Osborne 2017, 2013). 
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Ebenso zählen auch Dengler und Matthes (2018) mit Blick auf den Arbeitsmarkt 
lernende Computerprogramme neben der Robotik, virtueller Realität und 3D-Druck 
zu den aktuell bedeutendsten technologischen Entwicklungen. 


Bereits heute nutzen viele Firmen Kl-Anwendungen, um ihre Prozesse zu optimieren. 
Deren Einsatz ist dabei nicht nur auf Logistik, Produktion oder Marketing beschränkt. 
Vielmehr halten sie Einzug in alle primären und unterstützenden Aktivitäten von 
Unternehmen entlang der Wertschöpfungskette. Im Bereich der Logistik ermöglicht 
KI zunehmend intelligente und agile Lieferketten, die bei der Beschaffung von Bau- 
teilen vielfältige Informationen über mögliche externe Störungen einbeziehen und 
auf diese Weise mögliche Zukunftsszenarien wie Überbestände oder Materialeng- 
pässe antizipieren können. Dazu zählen beispielsweise Qualitätsprobleme bei Liefe- 
ranten, politische Instabilitäten in einer Region, Streiks von Beschäftigten oder 
ungünstige Wetterereignisse (Daugherty und Wilson 2018). Vielerorts sind bereits 
Kl-Anwendungen im Lager und bei der Optimierung der Bedarfsplanung etabliert. 
Demnach nutzen beispielsweise Amazon wie auch das Logistikunternehmen 
FedEx Kl, um Roboter im Warenlager zu steuern, gefälschte Ware zu erkennen oder 
auch Verpackungen und Lieferungen für den Kunden zu optimieren (Suich Bass 
2018; Metz 2018a). Walmart setzt in 50 Supermärkten mehr als 2.000 Roboter ein, 
um die Regale nach ausverkauften Artikeln, falschen Warenauszeichnungen und 
anderen Dinge zu durchsuchen, was normalerweise Aufgabe des Verkaufsperso- 
nals wäre. Unterdessen testet die Metro-Gruppe maschinelles Sehen im Kassen- 
bereich: Die Warenkörbe der Kunden werden von Kameras aufgezeichnet und ent- 
sprechende Rechnungen ausgestellt. Nach Schätzungen können die unbemannten 
Kassen etwa 50 Kunden pro Stunde - und damit etwa doppelt so viel wie menschli- 
che Kassierer — bedienen (Suich Bass 2018). 


In komplexen Industrieprozessen wie der Fertigung übernehmen hochentwickelte 
KI-Systeme zunehmend kritische Funktionen wie die Wartung von Maschinen. Auf 
Basis von umfangreichen Statistiken über die Maschinennutzung und Umweltbedin- 
gungen können diese Maschinenausfälle vorhersagen, bevor sie überhaupt auftreten 
(„predictive maintenance“). Damit müssen Wartungsarbeiter in der Fertigung sich 
weniger mit Routinekontrollen und Fehlerdiagnosen aufhalten. Sie können nach 
Daugherty und Wilson (2018, S. 30) mehr Zeit in „knifflige“ Reparaturen stecken 
und daraus auch mehr Motivation und Zufriedenheit ziehen. Unterdessen erlangen 
die Produktionsingenieure ein besseres Verständnis der die Materialbeschaffenheit 
von Bauteilen und möglicher Ineffizienzen in den Produktionsprozessen. Insbeson- 
dere solche Unternehmen mit großen Vermögenswerten und kapitalintensiven Wert- 
schöpfungsprozessen werden von der vorausschauenden Wartung profitieren. Dazu 
zählen beispielsweise Fluggesellschaften, Ölfirmen, Energieunternehmen und große 
produzierende Industrieunternehmen, in denen unerwartete Maschinenausfälle 
hohe Kosten verursachen (Suich Bass 2018). 
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Im Personalwesen nutzen große Unternehmen bereits Kl, um Bewerbungen zu sor- 
tieren und die besten Kandidaten auszuwählen. Beispielsweise erhält das Konsumgü- 
terunternehmen Johnson & Johnson etwa zwei Millionen Bewerbungen pro Jahr für 
insgesamt 25.000 Stellen (Suich Bass 2018). Kl-fähige Systeme sind dabei zu einem 
objektiveren Abgleich der stellenbezogenen Anforderungen und bewerberspezifi- 
schen Charakteristika in der Lage. Demnach sind Algorithmen, wenn sie entspre- 
chend programmiert sind, auch unparteiischer und fairer als der Mensch. Dies gilt für 
die Einstellung neuer Mitarbeitender wie auch für die Auswahl von Beschäftigten für 
Beförderungen oder Lohnerhöhungen (Al-spy 2018). 


Das Personalwesen wie auch andere administrative Prozesse im Hintergrund (z. B. 
Rechnungswesen, Kundenbeziehungs- und Beschwerdemanagement) bestehen oft 
aus klar definierten, sich wiederholenden und wenig sichtbaren Aufgaben. Durch die 
Unterstützung von KI können sich die Beschäftigten hier wieder auf höherwertige, 
weniger standardisierte und unstrukturierte Aufgaben konzentrieren. Beispielsweise 
nutzt die Investmentbank Goldman Sachs Kl, um aus einer sehr großen Anzahl von 
Marktdaten und -analysen die wichtigsten Einflussfaktoren auf Aktienkurse zu iden- 
tifizieren. Die Huffington Post - wie auch andere Online-Medien - verwendet Kl, um 
ihre menschlichen Moderatoren bei der Identifikation von unangemessenen Kom- 
mentaren, Spam oder anderweitigem Missbrauch zu unterstützen (Daugherty und 
Wilson 2018). 


Bei standardisierten Inhalten wie in Börsenberichten, Sportmeldungen oder Wetter- 
nachrichten fassen Kl-Anwendungen die wichtigsten Informationen bereits in leicht 
verständlicher Sprache zusammen. Die Agenturen Bloomberg und Associated Press 
lassen deshalb seit einigen Jahren kürzere Meldungen und Quartalsberichte von 
intelligenten Anwendungen wie „Wordsmith” verfassen (Jensen 2015). Das Vorge- 
hen ist dabei sehr strukturiert: Der „Schreibroboter” hat Zugriff auf umfangreiche 
Datensätze aus unterschiedlichen Quellen. Diese untersucht er nach Informationen 
mit Neuigkeitswert. Kriterien zu Relevanz und Interessantheitsgrad legen Software- 
Programmierer in Abstimmung mit dem Kunden (hier: Associated Press) fest. Im 
Anschluss wählt der „Schreibroboter“ für jede Information eine vordefinierte rheto- 
rische Perspektive aus, sortiert die Informationen nach Wichtigkeit und macht Ver- 
knüpfungen zu weiteren relevanten Bezügen wie Orten, Zeitpunkten und histori- 
schen Ereignissen. Wie in anderen Branchen kommt es im Journalismus damit zu 
einer neuen Arbeitsteilung zwischen Mensch und Maschine (Jensen 2015). 


Auch in der Medizin und im Gesundheitswesen werden große Anwendungsmöglich- 
keiten für KI gesehen. Mittels Mustererkennung in Bildern, Texten und anderen Infor- 
mationsquellen können Alghorithmen beispielsweise Diagnoseverfahren unterstüt- 
zen, Behandlungspläne vorschlagen oder neue Hypothesen für die medizinische For- 
schung generieren (Ramge 2018, S. 19; siehe Teil B, Beitrag 8 „Perspektiven der Kl in 
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der Medizin”). Die wissenschaftlich-empirische Vorgehensweise in abgegrenzten, 
zyklisch wiederholbaren Arbeitsschritten - von der Datenerfassung, über die Bildung 
von Hypothesen und Durchführung von Experimenten bis hin zur Ableitung genera- 
lisierbarer Theorien - eignet sich in idealer Weise zur Unterstützung durch KI. Ange- 
sichts einer stetig wachsende Zahl neuer wissenschaftlicher Arbeiten (etwa 2,5 Milli- 
onen pro Jahr) und digitaler Patientendaten kann KI die Informationen strukturieren, 
analysieren und Hinweise geben; und wo es für Mediziner und Wissenschaftler loh- 
nenswert erscheint, kann KI weitere Nachforschungen anstellen (Daugherty und Wil- 
son 2018, S. 69f.). 


Ein unmittelbares Anwendungsfeld ist die Arzneimittelverordnung: Beispielsweise 
nutzt etwa die Hälfte der Ärzte in den USA die App „Epocrates”, welche Hinweise 
auf schadhafte Wechselwirkungen von Arzneimitteln geben kann. Damit entfällt das 
zeitaufwendige, zum Teil ergebnislose Nachschlagen in einem 2.500-seitigen Arznei- 
mittel-Referenzhandbuch. Mit dem von KI beförderten medizinischen Fortschritt 
könnte auch verlorengegangenes Vertrauen beim Patienten wiederhergestellt wer- 
den. Laut einer Umfrage des British Medical Journal waren 49 Prozent der Leser der 
Meinung, dass die heutige evidenzbasierte Forschung unzureichend und fehlerhaft 
sei. Kl-basierte Analysen einer breiteren Datenbasis zur Ableitung von medizinischen 
Diagnosen, Prognosen und Therapien können neues Vertrauen schaffen (Suesskind 
und Suesskind 2015). 


Durch den Einsatz von Kl ergeben sich vor allem drei positive Auswirkungen auf die 
Qualität der Arbeit. Dazu zählen die Steigerung menschlicher Fähigkeiten, die Demo- 
kratisierung von Fachwissen aufgrund eines gleichberechtigten Informationszugangs 
und die „Re-Humanisierung“ von Arbeit durch den Wegfall zeitaufwändiger Routi- 
neaufgaben. Dies wirkt sich wiederum positiv auf die Motivation der Beschäftigten 
und die Inklusionspotenziale von Arbeit aus. 


Handlungsräume 


Die beschriebenen Einsatzszenarien von KI verdeutlichen einerseits die zunehmende 
Anzahl von Kl-Anwendungen auf der Arbeitsebene und zeigen andererseits, dass KI 
stets nur jene Tätigkeiten ausführen kann, die repetitiv, strukturierbar und datenba- 
siert sind. Auch skizzieren die Beispiele das Spannungsfeld, in dem sich die Diskus- 
sion um die Auswirkungen von KI auf die Arbeit bewegt. Während Pessimisten die 
Weiterentwicklung von KI mit massiven Beschäftigungsverlusten durch die Substitu- 
tion von menschlicher Arbeit in immer neuen Arbeitsfeldern in Verbindung bringen, 
stellen Optimisten die Chancen in den Vordergrund, insbesondere die Verbesserung 
der Qualität der Arbeit sowohl aus Sicht der Arbeitgeber als auch der Beschäftigten 
durch KI zu erhöhen aber auch eine (Höher-)Qualifizierung von Migrantinnen und 
Migranten, Geringqualifizierten und Menschen mit Behinderung zu ermöglichen 
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(Zeumli und Thielicke 2017; Apt et al. 2018; Narloch 2018). Welche von beiden 
Erwartungen die zukünftige Arbeitswelt prägen wird, ist heute kaum absehbar. Im 
Umkehrschluss bedeutet diese Unsicherheit aber auch, dass der Transformationspro- 
zess mitnichten deterministisch ist, sondern für Beschäftigte, Unternehmen und die 
Politik vielfältig gestaltbar ist. Die zentrale Herausforderung liegt wohl darin, einem 
„Digital Divide” auf dem Arbeitsmarkt entgegenzuwirken, bei dem einige von der 
technologischen Entwicklung weiter profitieren, während andere zunehmend abge- 
hängt werden. 


Arbeitnehmer müssen daher gezielt aus- und weitergebildet werden, um auch bei 
einer wachsenden Technisierung ihre Beschäftigungsfähigkeit zu erhalten. Der 
Mensch wird der Technik in den kommenden Jahrzehnten bei vielen Tätigkeiten 
überlegen bleiben, und es ist Aufgabe politischer Entscheidungsträger, der Unter- 
nehmen und der Wissenschaft, die notwendigen Kompetenzen zur Ausführung die- 
ser Tätigkeiten zu identifzieren und durch Aus- und Weiterbildungsmaßnahmen zu 
fördern. Beispielweise bietet das World Economic Forum einen neuen, praxisnahen 
Ansatz, bei dem auf Grundlage von Arbeitsmarktdaten und Daten von Online-Stel- 
lenbörsen die Ähnlichkeit von fast tausend Berufen in den USA empirisch ermittelt 
wird, um anschließend unter Berücksichtigung von prognostizierten Berufsanforde- 
rungen Umschulungspfade für Beschäftigte aufzuzeigen (World Economic Forum 
2018). Derartige Bestrebungen gilt es dahingehend weiterzuentwickeln, jedem Ein- 
zelnen Möglichkeiten für ein lebenslanges Lernen aufzuzeigen und somit seine 
Chancen auf Beschäftigung in der Arbeitswelt der Zukunft zu erhöhen. 


Des Weiteren sollte man bei der Ausgestaltung von Kl-Anwendungen stets beden- 
ken, wie damit die menschlichen Fähigkeiten erweitert und die Zusammenarbeit zwi- 
schen Mensch und Maschine verbessert werden können (Bergstein 2017). Gleichzei- 
tig müssen Unternehmen und Politik Aufklärungsarbeit leisten, um falschen Ängs- 
ten, aber auch überzogenenen Erwartungen entgegenzuwirken und damit einen 
transparenten und nutzenbringenden Einsatz von KI zu forcieren. Wichtige Bedin- 
gungen dafür, dass der Einsatz von KI gelingen kann, sind darum auch Transparenz 
der zugrundeliegenden Algorithmen, die Anonymität der erfassten Daten und Chan- 
cengleichheit. 


Auch wenn die Technologien im Grunde „neutral” Daten über Arbeits- und 
Geschäftsprozesse erfassen, sind sie möglicherweise nicht frei von den Vorurteilen 
ihrer Programmierer, können unbeabsichtigte Konsequenzen haben und bestimmte 
Gruppen von Beschäftigten oder auch Bewerbern diskrimieren (Al-spy 2018). Bisher 
ist wenig reguliert, wie und welche Daten im Arbeitsprozess erfasst werden. Mit 
Unterzeichnung ihres Arbeitsvertrages stimmen die Beschäftigten einer Überwa- 
chung ihrer Arbeitstätigkeiten meistens unbewusst zu. Auch ist oft nicht geklärt, was 
mit den personenbezogenen Daten aus Arbeitsprozessen geschieht, wenn ein Mitar- 
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beiter das Unternehmen verlässt. Eine Möglichkeit wäre, dass der scheidende Mitar- 
beiter „seine” Daten mitnimmt und etwa dazu nutzt, gegenüber neuen Arbeitge- 
bern sein Können und seine Arbeitseffizienz zu belegen. Somit ist offensichtlich, dass 
der Einzug von KI in die Arbeitswelt neue Kompromisse zwischen der Privatsphäre 
der Beschäftigten und den Effizienzbestrebungen der Unternehmen erforderlich 
macht (Al-spy 2018). 


Die seit dem Jahr 2018 in Deutschland greifende EU-Datenschutzgrundverordnung 
(DSGVO) bezieht sich explizit auf das Spannungsverhältnis von Datenschutz und KI: 
Gemäß Artikel 22 der DSGVO hat eine Person „das Recht, nicht einer ausschließlich 
auf einer automatisierten Verarbeitung - einschließlich Profiling — beruhenden Ent- 
scheidung unterworfen zu werden, die ihr gegenüber rechtliche Wirkung entfaltet 
oder sie in ähnlicher Weise erheblich beeinträchtigt”. Auch sind in der DSGVO neue 
Grundsätze zum Transparenzgebot und Diskriminierungsverbot enthalten, was dem 
Einsatz von Kl in Unternehmen enge Grenzen setzt. Wer KI-Systeme einsetzen wolle, 
müsse sich umfangreich bei seinen Beschäftigten absichern (Krempl 2018). 


Doch nicht nur aufgrund der neuen Herausforderungen aus der DSGVO verzögert 
sich die Umsetzung von KI in den Unternehmen. Sie stockt auch, weil Fachkräfte in 
den Bereichen Software Engineering, Informatik und Robotik fehlen. In den USA 
saugen große Unternehmen mit datenbasierten Geschäftsmodellen den KI-Talent- 
pool leer. Allein die Carnegie Mellon University verlor 40 Kl-Forschende an Uber, als 
das Dienstleistungsunternehmen ein Labor in Pittsburgh eröffnete. Auch Facebook 
eröffnete neue KI-Forschungslabore in Seattle und Pittsburgh und erhöht damit den 
Druck auf die lokalen Universitäten, ihre Professoren und Forschungsangestellten zu 
halten. Oft können sie jedoch nicht mit den hohen Gehältern der Tech-Branche mit- 
halten. Dan Weld, Informatik-Professor an der Universität von Washington, sagt: „Es 
ist besorgniserregend, dass sie unsere Saat verspeisen. Wenn wir alle unsere Lehrbe- 
auftragten verlieren, wird es schwierig sein, die nächste Forschergeneration auszubil- 
den.” (Metz 2018b). 


Gegenwärtig setzen vor allem die Tech-Industrie und große Unternehmen KI ein, wo 
sie Effizienzgewinne, individualisierte Dienstleistungen und neue Produkte befördern 
soll. Für Einrichtungen und Unternehmen aus anderen Branchen — wie etwa der 
Medizin, Fertigung und Energie - könnte es zwar einen ähnlichen Schub für Produk- 
tivität und Wertschöpfung geben, die Kl-Systeme sind jedoch noch zu teuer und 
schwer zu implementieren. Es stellt sich deshalb die Frage, ob die inzwischen zahlrei- 
chen Prognosen zu Automatisierung und Beschäftigungseffekten nicht allesamt zu 
kurz greifen, da von den Autoren zumindest die mittelfristige Wirkung von KI auf die 
Arbeit überschätzt werden könnte. Nach Ramge (2018, S. 19) müssten KI-Systeme 
„hohe Hürden überwinden, bevor Menschen ihren Urteilen und Entscheidungen 
trauen”. Zudem seien Laien kaum allein in der Lage „künstlich intelligenten Rat- 
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schlag“ einzuholen. Für Wissensarbeiter hieße das wiederum, dass nicht KI sie in 
absehbarer Zukunft substituieren wird, sondern „tech-affine Verkäufer, Anwälte und 
Ärzte werden jene Kollegen ersetzen, die KI nicht als Entscheidungsassistenten intel- 
ligent zu nutzen wissen.” (Ramge 2018, S. 20). Auch das World Economic Forum 
sieht die größten Zukunftschancen für jene, die komplementär mit algorithmenba- 
sierten Technologien arbeiten können (World Economic Forum 2018). 
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12. Neue Intelligenz, neue Ethik? 


Julian Stubbe, Jan Wessels, Guido Zinke 


Aus den vergangenen Jahren gibt es unzählige Beispiele für die beeindrucken- 
den Entwicklungen im Bereich der Künstlichen Intelligenz (Kl). Voran getrie- 
ben werden sie durch die jetzt verfügbaren Datenmengen, Rechenleistungen 
und besonders durch die großen Fortschritte im maschinellen Lernen (Machine 
Learning, ML), insbesondere dem tiefen Lernen (Deep Learning, DL). Dies wird 
erhebliche Einwirkungen auf sämtliche sozialen, politischen und ökonomi- 
schen Systeme haben. 


Nicht allein die Zeitschrift Economist sieht einen fundamentalen Wandel nahen, 
durch den künftig nicht mehr die Maschine vom Menschen lerne, sondern umge- 
kehrt. Und die Maschine lerne viel schneller und eigne sich dank ihrer wachsenden 
Leistungsfähigkeit menschliche Eigenschaften wie Kreativität, Intuition, Iteration und 
Impulsivität an (The Economist 2016). Einige Autoren sehen in der Kl eine existen- 
zielle Herausforderung der Menschheit, u. a. der kürzlich verstorbene Stephen 
Hawking oder der Tech-Unternehmer Elon Musk. Sie leugnen nicht den Nutzen der 
KI, erwarten aber einen Wettlauf mit einer möglichen „Superintelligenz”, den der 
Mensch u.a. deshalb verliere, weil er in evolutionären Prozessen nicht schritthalten 
könne (Handelsblatt 2014, FAZ 2017). 


Vor diesem Hintergrund ist die Auseinandersetzung mit der ethischen Dimension von 
KI von einer rein akademisch-philosophischen zu einer gesellschaftlichen und innova- 
tionspolitischen Debatte gewachsen. Das zunehmende Interesse an der Ethik einer Kl 
kommt nicht von ungefähr, schließlich greifen Algorithmen tief in gesellschaftliche 
Zusammenhänge ein und sind nicht auf spezifische Anwendungsdomains beschränkt. 
KI verändert Wertschöpfungsprozesse genauso wie die private Kommunikation und 
die Interaktion der Menschen. Und dieser Einfluss wird insbesondere dann deutlich 
wachsen, wenn der Schritt von der jetzigen schwachen KI (durch den Menschen 
vorgegebene bzw. programmierte Algorithmen) hin zu einer starken KI (die sich 
selbst gestaltet bzw. fortentwickelt, siehe Einleitung zu Teil A Technologie „Entwick- 
lungswege zur KI”) gegangen wird. Umso drängender sind Antworten auf jene Fra- 
gen zu finden, was diese Schlüsseltechnologie mit unserer Gesellschaft macht und 
wie sie die uns bekannten Lebens- und Arbeitswelten verändern wird. Populäre Tech- 
nologiemagazine greifen das Thema vermehrt auf und bereiten es verständlich für 
eine breite Bevölkerungsgruppe auf. Öffentliche Institutionen reagieren parallel, z. B. 
durch den Deutschen Ethikrat oder in Frankreich durch die nationale Datenschutzbe- 
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hörde und eine breitangelegte gesellschaftliche Debatte. Ebenso wächst das private 
bzw. unternehmerische Engagement, wenn internationale Initiativen wie etwa Ope- 
nAl einen demokratischen und insbesondere weniger Eliten-zentrierten Zugriff auf KI 
zu ermöglichen und die Souveränität des Menschen im Umgang mit der Maschine 
sowie die Akzeptanz zu stärken suchen. 


Solche Bestrebungen erfahren aktuell eine große Resonanz, auch ausgelöst durch 
eine wachsende KI-Skepsis in der Bevölkerung. Aktuelles Beispiel für ein neues 
Bewusstsein ist Facebook. Das Unternehmen geriet zunehmend unter öffentlichen 
Druck, seine gesellschaftliche Verantwortung wahrzunehmen und manipulative 
Praktiken zu unterbinden. Dies zeigt, wie der ausgeprägte Glaube an das enorme 
technologische Lösungspotenzial einer KI vielerorts zur Annahme führte, ihre Innova- 
tionen würden auf große Akzeptanz in der Gesellschaft stoßen. Ein solcher „techni- 
scher Imperativ” findet aber gleichwohl nicht unbedingt das erhoffte positive Echo in 
der Gesellschaft. Stattdessen antizipieren Anbieter von Kl-Technologien mittlerweile 
selbst Missbrauch und Akzeptanzverlust und leiten entsprechende Maßnahmen in 
Richtung eines ethischen Imperativs einer Kl ein. 


In der aktuellen Debatte über die ethische Dimension von KI steht deshalb eine Frage 
im Mittelpunkt: Wirft KI neue, über den bestehenden Diskurs hinausgehende ethi- 
sche Fragen auf, oder verstärkt sie bereits im Vorfeld existierende Spannungsfelder? 


Autonomes Entscheiden 


Der zentrale Nutzen von KI besteht in ihrer prinzipiellen Fähigkeit, ohne menschliche 
Einwirkung selbstständig — autonom - Entscheidungen zu treffen. Zur Diskussion 
steht dabei die Frage, inwieweit und wann Maschinen dies tun sollten und können 
und welche Konsequenzen dies hat. Ethisch relevant sind vor allem negative Folgen, 
wenn also Menschen zu Schaden kommen oder Dinge beschädigt werden. In diesem 
Fall ist zu fragen, wer die Verantwortung dafür trägt bzw. wer dafür haftet. Ein Algo- 
rithmus ist schließlich keine juristische Person. Um die Koexistenz von Mensch und 
Maschine zu organisieren, definiert die Ethik für autonome Entscheidungssysteme 
also vor allem den Aspekt der Verantwortung. 


Sehr eingängig lässt sich dieses Dilemma am Beispiel des autonomen Fahrens nach- 
zeichnen. Da die Maschine keine juristische Person ist, sollte im Schadensfall geklärt 
werden können, wer letztlich verantwortlich ist. Typischerweise hat der menschli- 
che „Fahrer“ im Moment der Schadensentstehung keinen Einfluss auf die Entschei- 
dungsfindung gehabt, kann also nicht verantwortlich sein bzw. werden. Dies gilt 
auch für den Programmierer des autonomen Systems, der möglicherweise nur die 
Ausgangsversion einer Software geschrieben hat, die sich dann selbstlernend wei- 
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terentwickelte. Dennoch müssen Geschädigte eine Chance auf Entschädigung 
haben. 


Deshalb stehen unter anderem auch ethische Aspekte auf der Tagesordnung der 
Politik. So wurden entsprechende Experten-Gremien etabliert oder parlamentarische 
Auseinandersetzungen initiiert. Für Deutschland besonders relevant ist die Einrich- 
tung einer Ethikkommission zum autonomen Fahren durch das Bundesministerium 
für Verkehr und digitale Infrastruktur (BMVI) im Jahr 2016 (BMVI 2016) sowie die 
Entschließung des Europäischen Parlaments zu Robotik und Künstlicher Intelligenz 
Anfang 2017. Diese fordert, für das autonome Fahren eine Pflichtversicherung ein- 
zuführen sowie einen Zusatzfonds, der die nötigen Mittel für eine hinreichende Ent- 
schädigung gewährleisten soll (Europäisches Parlament 2017). Auch der Deutsche 
Ethikrat hat sich wiederholt mit dem Thema KI auseinandergesetzt, zuletzt auf seiner 
Jahrestagung im Juni 2017 (Deutscher Ethikrat 2017). Schließlich sieht der Koaliti- 
onsvertrag zwischen CDU, CSU und SPD aus dem Februar 2018 eine Ethikkommis- 
sion zu digitalen Fragen vor, die auch den Aspekt KI behandeln soll (Bundesregierung 
2018). 


Der Diskurs um die Verantwortlichkeit klärt also in erster Linie, welche Rollenver- 
ständnisse sich zwischen Mensch und Maschine ausprägen. Ebenso ethisch relevant 
und damit intensiv diskutiert ist die Frage, nach welchen Kriterien autonome Ent- 
scheidungen überhaupt zustande kommen. Dies betrifft in erster Linie die Würde des 
Menschen. Denn hier existieren klassische Dilemmata, die vorab durchdacht und auf 
ihre Relevanz geprüft werden müssen. So kann ein Entscheider vor der Alternative 
stehen, zwischen zwei Optionen wählen zu müssen, die beide negative Auswirkun- 
gen haben. In der Literatur ist dies als Trolley-Problem bekannt (Heise 2017). 


Dazu hat z. B. die Ethikkommission zum autonomen Fahren des BMVI in ihrem 
Abschlussbericht festgehalten, dass grundsätzlich Sachschaden einem Personen- 
schaden vorzuziehen ist, also Menschen auf jeden Fall geschützt werden müssen. 
Eine Einteilung von Menschen in verschiedene Gruppen mit unterschiedlichem 
Schutzstatus darf es aus Sicht der Ethikkommission nicht geben. Alter, Geschlecht 
oder ähnliche Faktoren dürfen also bei Entscheidungen eines autonomen Systems 
keine Rolle spielen, junge Menschen dürfen z. B. keinen höheren Schutz genießen als 
Alte oder Kranke. 


Daran knüpft sich ein weiterer wichtiger Aspekt, der zweifelsohne einen erheblichen 
Einfluss darauf hat, ob Kl sich durchsetzt und Akzeptanz findet. Denn die Frage nach 
den Entscheidungskriterien verlangt, dass die Entscheidungsprozesse selbst und die 
ihnen zugrunde liegenden Annahmen transparent sind - und zwar auf Seiten des 
Menschen und der Maschine. Es muss nachvollziehbar sein, auf welcher Basis Ent- 
scheidungen getroffen wurden. 
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Transparenz ist auf der technischen Ebene allerdings keine leicht zu lösende Aufgabe, 
denn selbstlernende Systeme lassen eine Nachvollziehbarkeit nicht ohne Weiteres zu. 
Damit sind auch mögliche diskriminierende Kriterien nicht sichtbar. So hat sich bei 
der Nutzung von KI im amerikanischen Justizsystem gezeigt, dass Minderheiten 
benachteiligt werden und damit das Gleichheitsgebot verletzt wird. Eine wichtige 
Forderung der Kritiker von KI lautet deshalb, die Transparenz der Entscheidungsfin- 
dung wirklich sicherzustellen oder zumindest Kontrollsysteme zu entwickeln, die im 
Nachhinein die Entscheidungsfindung rekonstruieren können (reverse engineering). 
Wie sich so etwas gestalten kann, zeigt New York City. Dort gewährleistet künftig 
eine eigens geschaffene Verordnung, dass die vielfältig eingesetzten Algorithmen in 
der Stadtverwaltung eingesehen werden können und Bürger das Recht auf umfang- 
reiche Information erhalten. Damit soll eine Diskriminierung aufgrund unzureichen- 
der oder fehlerhafter KI verhindert werden, und die Bürger haben gegebenenfalls 
eine realistische Möglichkeit, dagegen juristisch vorzugehen (Netzpolitik 2018). 


Im ethischen Diskurs, ob, inwieweit und entlang welcher Kriterien Maschinen im 
Zusammenspiel mit dem Menschen autonom entscheiden, geht es also in erster Linie 
um das Ausmaß der Verantwortlichkeit, die der Mensch der Maschine in der Organi- 
sation einer künftigen Koexistenz überträgt. Im Kern drückt sich damit aus, ob der 
Einsatz oder Nicht-Einsatz künstlicher Intelligenz einen Unterschied macht - oder 
besser: bis zu welchem Grad autonomen Entscheidens der Einsatz von KI einen 
Unterschied macht. Die ethischen Anforderungen an autonome entscheidende Sys- 
teme und den Grad der Verantwortungsübertragung von Mensch auf Maschine 
ergeben sich also aus den antizipierenden Abwägungen, inwieweit die durchaus 
erheblichen Vorteile für viele Menschen in einem verträglichen Verhältnis zu den in 
spezifischen Situationen auftretenden Nachteilen für einzelne Betroffene stehen. 
Dies illustrieren die Festlegungen der Ethikkommission zum autonomen Fahren sehr 
gut: In Anbetracht der Erwartungen, dass der Einsatz von KI beim autonomen Fahren 
die Zahl der Verkehrstoten voraussichtlich drastisch verringern wird, ist ihr Einsatz 
selbst bereits ethisch geboten, um Menschenleben zu schützen. Dies gilt auch, wenn 
im Einzelfall Menschen durch fehlerhafte KI zu Schaden kommen. 


Neues Zusammenleben und -arbeiten 


Im Mittelpunkt des Diskurses um die ethischen Anforderungen an das Zusammenle- 
ben und -arbeiten von Mensch und KI stehen Fragen um die Übertragung der Leis- 
tungsfähigkeiten des Menschen auf die Maschine. Hierdurch erweitert sich der Dis- 
kurs zu den ethischen Anforderungen autonomer Verantwortung um Aspekte einer 
sukzessiven Übertragung von Aufgaben des Menschen an die Maschine. Dies mün- 
det letztlich in der Frage der Rolle des Menschen in einer Koexistenz mit der Maschine. 
Allein in den vergangenen fünf Jahren ist KI sehr sicht- und spürbar in die Lebens- 
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und Arbeitswelten vorgedrungen. Im Krankenhaus assistieren OP-Roboter, im Büro 
und im Alltag unterstützen smarte Assistenten den Menschen und im Verkehr 
ermöglichen intelligente Sensoren autonomes Fahren. Kontinuierlich wachsen 
dadurch die Interaktionen mit intelligenten Systemen, aus dem „artificial” in Al, der 
englischen Abkürzung für KI, wird ein „augmented“. KI wird allgegenwärtig. Dabei 
zeigen sich Nutzen, aber auch Risiken immer deutlicher. Etwa, wenn Algorithmen 
diskriminieren, weil sie aus den Informationen über die Handlungen der Menschen 
lernen (Süddeutsche 2017b), wenn autonome Systeme sich nicht mehr steuern las- 
sen, wenn Chatbots öffentliche Diskussionen dominieren oder wenn KI-Algorithmen 
zu kriminellen Zwecken eingesetzt werden. Nicht zu reden von den Gefahren intelli- 
genter Waffensysteme (Kleinberg et al. 2017). 


Dass KI immer mehr Aufgaben übernimmt, wird hier mitunter zum Problem. Und es 
erweist sich, dass ein Zusammenleben mit KI nicht zwangsläufig ein besseres sein 
muss. Das Selbstverständnis des Menschen prägt sich dabei entlang der Entschei- 
dung aus, ob er in eine existentielle Konkurrenz mit der Kl eintritt, oder aber ob er 
die Oberhand behält, indem die Position einer „Superintelligenz” klar geregelt ist 
und KI ihm sehr kontrolliert assistiert und sukzessive Aufgaben abnimmt. 


Dafür braucht es ethische und institutionelle Arrangements, die nicht die technologi- 
schen Möglichkeiten beschränken, wohl aber die Risiken benennen. Es geht dann 
nicht nur darum, wer Entscheider und wer verantwortlich ist, sondern auch darum, 
wer im Zusammenspiel Mensch-Maschine die Kontrolle behält und wie der Mensch 
einen eigenen Willen aufrechterhalten und schlussendlich auch durchsetzen kann. 
Die Beantwortung dieser Fragen ist aufgrund der enormen Komplexität von Kl-Syste- 
men, der Datenmenge und schieren Entwicklungsgeschwindigkeit alles andere als 
einfach. Inwieweit die Algorithmen fehlerfrei arbeiten und die Daten korrekt sind, 
kann der einzelne Nutzer kaum noch einschätzen. Und selbst Entwickler sind zum 
Teil überrascht von der sprunghaft steigenden Leistungsfähigkeit der Kl. Der Aufbau 
von Transparenz und Überwachungsstrukturen, von Standards und Sanktionsmus- 
tern ist darum die Grundvoraussetzung für eine ethisch verantwortungsvolle Nut- 
zung. Der kritische Umgang mit den Kl-Systemen und ihren Ergebnissen schaffen 
schließlich erst einen zumindest gesellschaftlich verträglichen Durchsatz von Kl. Dafür 
braucht es Vertrauen, basierend auf mehr menschlicher Souveränität und Kompe- 
tenz im Umgang mit Kl. 


Viele Akteure - nicht nur Kl-Kritiker, sondern auch die Politik und nicht zuletzt starke 
Profiteure von KI wie Google oder IBM - sind in den vergangenen Jahren in dieser 
Frage aktiv geworden. So lassen die Vereinten Nationen die Potenziale von KI auch 
unter ethischen Gesichtspunkten prüfen (UN 2017). Initiativen wie AINOW oder 
OpenAl wollen globale Standards für KI etablieren, um sie zu demokratisieren und 
vor allem weniger auf Eliten zentriert zu gestalten. Alle sollen KI nutzen können und 
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KI soll allen Nutzen bringen (AINOW 2018, BBC 2015). Google, Apple, Facebook und 
Amazon (GAFA) stellen KI-Tools als Open Sources bereit, um KlI-Souveränität zu för- 
dern und selbst von der Nutzung im Sinne einer Schwarmintelligenz zu profitieren 
(Die Zeit 2016b). Im „Partnership on Al” liefern GAFA und andere Kl-Lösungen für 
globale Probleme, u. a. um fehlerhafte KlI-Systeme zu stoppen (MIT TechRev 2016a, 
MIT TechRev 2016b, CBR 2017). Für Europa denkt man an die Einrichtung einer spe- 
zialisierten Forschungseinrichtung für Kl, an der die europäischen Kompetenzen 
wirkmächtig zur Untersuchung von Kl-Algorithmen gebündelt werden. Ein solches 
„KI-CERN” soll aber nicht nur helfen, technologisch mit USA oder China mithalten, 
sondern auch sozio-ökonomische Implikationen besser abschätzen zu können (Tech- 
Crunch 2017). Der Europäische Wirtschafts- und Sozialausschuss fordert ein europä- 
isches OpenAl (EESC 2017), während die EU-Kommission eine Al-on-Demand-Platt- 
form für Europa prüft (Al Business 2017). In Deutschland diskutiert die Politik zent- 
rale ethische Fragen ebenso wie die Wirtschaft, die sich u. a. ein System einer 
Corporate Digital Responsibility geben möchte (Süddeutsche 2018). Und in Frank- 
reich findet eine breite öffentliche Debatte um die Gestaltung des Zusammenlebens 
und Zusammenarbeitens mit KI statt (CNIL 2018). 


All diese Initiativen beziehen sich in erster Linie auf den Umgang mit der aktuellen 
„schwachen” Kl, der Menschen die Muster vorgeben bzw. von vornherein einpro- 
grammieren. Ethische Anforderungen richten sich hierbei zunächst konsequenter- 
weise nicht an die Maschine, sondern an den Menschen. Anspruchsvoller wäre die 
Formulierung geeigneter ethischer Anforderungen für eine deutlich höher entwi- 
ckelte „starke“ Kl. „Einfach den Stecker zu ziehen” (Die ZEIT 2017) würde hier nicht 
mehr gelingen, stattdessen bräuchte es eine echte Maschinenethik, eine artificial 
morality. Diese würde sich dann nicht mehr an den Menschen richten, sondern an die 
Maschine selbst. 


Die einfachste, heute diskutierte Lösung ist, komplexere KI permanent zu überwa- 
chen, während ein menschlicher Benutzer die Aufgaben vorab definiert hat und 
immer noch sämtliche ethisch relevanten Entscheidungen trifft. Dies ist in einigen 
Fällen sicher auch künftig denkbar. Dort jedoch, wo Kl extra deshalb eingesetzt wird, 
um menschliche Arbeit zu ersetzen, um schnelle Entscheidungen herbeizuführen, 
um Gefahren für den Menschen zu umgehen oder aber den Menschen selbst als 
Risikofaktor zu ersetzen, ist eine permanente Überwachung langfristig nicht realis- 
tisch (Ethik-Kommission AVF 2017). Denn es werden immer weniger Entscheidungs- 
situationen vorhersehbar und damit Handlungsmuster programmierbar sein. Im 
Zusammenleben mit Menschen sollten Maschinen daher selbst ethisch handeln und 
ein solches Handeln aus dem Umgang mit ihnen erlernen (Arkin 2009). 


Dafür müssen Maschinen grundsätzlich in die Lage versetzt werden, mit ihrer Umwelt 
zu interagieren, ihr Handeln an sich ändernde Bedingungen anzupassen und letztlich 
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eigenständig zu agieren. Solche Verhaltensmuster können auch heute schon einige 
KlI-Systeme leisten. Entwickelt KI zusätzlich die Fähigkeit, aus der Verarbeitung von 
Informationen Gründe für ihr Verhalten - dank Belief-Desire-Intention-Anwendun- 
gen - abzuleiten, wird sie grundsätzlich einem ethisch handelnden Akteur ähnlicher 
(Floridi und Sanders 2004, Dennett 1987). Noch erreicht die KI auf dieser Entwick- 
lungsstufe keine ganzheitliche Handlungsfähigkeit, die den Menschen auszeichnet, 
sondern lediglich die Fähigkeit, Ethik einzuschätzen und zu erkennen. Und dies ist 
auch nur auf einen bestimmten Handlungskontext beschränkt. Um ganzheitlich 
ethisch handlungsfähig zu sein, müsste sie Willen selbst ausprägen und Bewusstsein 
entwickeln können. Beides würde auch bedeuten, Emotionen zu empfinden - auch 
solche, die irrationales Handeln verursachen können (Scheutz 2011). 


In einem anthropozentrischen Weltbild wird eine freundliche, weil im Umgang mit 
dem Menschen ethisch korrekt agierende agierende KI benötigt. Noch besser: Sie 
sollte sogar korrekter als der Mensch handeln. Gerade hierin liegt auch ein großer 
Nutzen für die Koexistenz Mensch-Maschine: Jede Maschine agiert rational, weil ihr 
Handeln keiner emotional fundierten Willensbildung unterliegt und äußere Einflüsse 
die Rationalität kaum beeinträchtigen (Arkin 2009). Dies macht sie für das Zusam- 
menleben berechenbarer, nachvollziehbarer und letztlich steuerbarer. Und: Die ethi- 
schen rationaleren Handlungsmuster werden in gewisser Weise zu Blaupausen für 
die Gesellschaft selbst. Eine so sich evolutionär ausprägende artificial morality ist 
dann jener Spiegel, den die KI den Menschen vorhält. 


Veränderte Identitäten 


Verändert die wachsende Ausprägung von KI bekannte Verantwortungsmuster und 
das Aufgabenverhältnis im Zusammenleben und -arbeiten, bleibt dies nicht folgenlos 
für das Rollen- und letztlich Selbstverständnis des Menschen. Mit dieser Frage dringt 
die KI-Ethik in die Bereiche individueller, menschlicher Identitätsbildung und Soziali- 
sation vor. 


Inwiefern KI Zugriff auf diese intimste, mithin wichtigste Ebene der Gesellschaft 
erlangen wird, hängt technisch gesehen davon ab, wie viele Daten wir über uns 
selbst erzeugen, wie wir mit diesen umgehen und in welchem Maß wir verstehen, 
wie KI diese Daten nutzt. Bei der Frage nach den Auswirkungen von KI auf unser 
Selbstverständnis verschmelzen somit die Diskurse um Verantwortung, Aufgaben 
und Rolle des Menschen in der Koexistenz mit Kl. Die entstehenden Verantwor- 
tungsmuster in sich wandelnden Lebens- und Arbeitswelten münden also letztlich 
in neuen Sozialisationsformen, die auf neue Art identitätsstiftend bzw. verändernd 
wirken werden. Statt also KI als isolierten Faktor zu betrachten, gilt es vielmehr, 
ihre ethischen Implikationen in einem Netz verschiedener Veränderungen zu ver- 
stehen. 
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Welche Effekte KI auf die Bildung und Entfaltung von Identität hat, ist keine neue 
Frage. Bereits 1984 untersuchte Sherry Turkle aus mikro-soziologischer Perspektive 
die Wirkung der Auseinandersetzung mit KI auf die Persönlichkeitsentfaltung von 
Wissenschaftlern (Turkle 1984). Sie stellte fest, dass KI häufig zu einem „evozieren- 
den Objekt” wird, anhand dessen Menschen sich selbst und ihr Wesen hinterfragen. 
Intelligenz künstlich zu produzieren bzw. zu simulieren knüpft sich unter diesen 
Annahmen an die Frage, was Intelligenz denn eigentlich ist und welche Aspekte 
davon uns zum Menschen machen. 


Diese Auseinandersetzung ist nicht allein akademischer Natur, sondern ein häufiges 
Motiv in Literatur und Film für ein großes Publikum. Dass etwa die Unterscheidbar- 
keit von Mensch und Maschine zu einer gesellschaftlichen und exekutiven Herausfor- 
derung werden kann, war bereits im Jahr 1962 der Plot in Philip K. Dicks Roman 
„Träumen Androiden von elektrischen Schafen?”, den der Regisseur Ridley Scott 
zuerst 1982 in „Blade Runner” und fortgesetzt 2017 in „Blade Runner 2049" sehr 
erfolgreich inszenierte. Es gelang, das enorme Spannungsfeld zwischen KI und Men- 
schen eindrücklich darzustellen. Die Auswirkungen der emotionalen Bindung eines 
Menschen zu einer KI ist wiederum Thema im Film „Her”. Und was passieren kann, 
wenn die Maschine vom Werkzeug zum Partner mit Intention und Persönlichkeits- 
merkmalen wird, zeigt der Spielfilm „Ex Machina“. Das dort dargestellte manipula- 
tive Wesen der Maschine ist jedoch nicht vorprogrammiert, sondern Resultat und 
Reflex auf Informationen, mit der die KI durch Online-Suchanfragen gefüttert wird. 


Die ethische Diskussion über das Verhältnis von Mensch und KI ist also auch Teil 
populärer Kultur, die so auch Reflexion beinhaltet. Dennoch ist der ethische Gehalt 
der Science Fiction begrenzt, denn sie liefert wenig Orientierung für das praktische 
Handeln. Die praktische Relevanz der Reflexion wird jedoch in zwei Dimensionen der 
Identitätsbildung ersichtlich: einer materiellen und einer sozialen. 


Die materielle Dimension der Identität betrifft die Art, wie Menschen durch den 
Umgang mit Dingen ihre Persönlichkeit finden und ausdrücken. Der Anthropologe 
Daniel Miller versteht Identität und Materialität als zwei zusammengehörige Ele- 
mente: Erst durch Interaktion mit der materiellen Welt finden Menschen heraus, wer 
sie sind, was sie gestalten können und wo ihre Grenzen liegen (Miller 2014). Aus 
dieser Perspektive entstehen kulturelle Typen, wie z. B. Sari tragende Frauen, erst im 
Zusammenspiel von sozialen Werten und materiellen Dingen, in diesem Fall einem 
leichten Stoff, der verhüllt und gleichzeitig sanft fällt. Dieses Prinzip führen Men- 
schen online in sozialen Netzen fort, wenn sie sich mit Fotografien inszenieren. KI 
jedoch beginnt, Identität zu entmaterialisieren, indem sie repräsentierte Gegen- 
stände auf ihren informatorischen Gehalt reduziert — Haptik, Ecken, Kanten und 
Gebrauchsspuren kennt die KI nicht. Jedoch sind es gerade diese materiellen Spuren 
und Eigenarten, die aus profanen Dingen persönliche Gegenstände machen und 
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mehr Bedeutung für das Individuum haben als ein vorgegebener Zweck. Mit KI, so 
die Befürchtung, wird die körperlich-materielle Erfahrung der Welt und des eigenen 
Selbst von einer sterilen, austauschbaren und geglätteten Inszenierung eines „Quasi- 
Selbst“ abgelöst. Damit geht auch das materielle Erbe eines Menschen verloren: Per- 
sönliche Gegenstände, die Geschichten erzählen, verschwinden zugunsten von 
Datenprofilen, die sich aus beliebigen Punkten zusammensetzen (Unlimited World 
2017). 


Identität zeigt eine soziale Seite insbesondere dort, wo sie durch Interaktionen mit 
anderen Menschen entsteht. KI ist bereits heute sowohl Interaktionspartner als auch 
-filter. Dienstleistungen wie Spotify, Facebook oder Amazon wissen bereits mehr 
über persönliche Präferenzen als die engsten Freunde. Algorithmen erhärten Kauf- 
entscheidungen und Geschmacksnuancen. Sie determinieren so die Präferenzen 
ihrer Nutzer. Nach der Kritik hieran entstanden sogenannte encoding-Algorithmen, 
die alternative Vorschläge machen sollen, um die Souveränität des Nutzers zu stär- 
ken. Nur lösen sie das Problem nicht, eher im Gegenteil: Sie wirken noch manipula- 
tiver, weil sie eine scheinbar objektivierte Präferenzfindung suggerieren. Das Ergebnis 
ist aber das Gleiche: Die Souveränität der Nutzer wird gewollt - oder auch nicht - 
drastisch reduziert. Ähnlich wirken Siri und Alexa, die sehr gefügig und wenig kont- 
rovers einen emotionslosen Austausch simulieren. Kommunikation verliert hier ihre 
Ambivalenz, mit der wir durch soziale Erfahrungen umzugehen wissen und durch die 
wir herausfinden, wie wir auf andere wirken und wer wir für die andere Person sind. 
Aus ethischer Perspektive ist diese Art der Kommunikation mit Kl, die eine vermeint- 
lich partnerschaftliche soziale Interaktion simuliert, hintergründig aber strategische 
Zwecke verfolgt, hochgradig bedenklich. 


Ein sehr eindrückliches Beispiel ist hierfür die „Hello-Barbie-Puppe” von Mattel (NYT 
2015). Diese sprechende Puppe verwickelt Kinder mit Hilfe von Spracherkennung 
und Kl in ein Gespräch, das dem einer realen Freundschaft nachempfunden ist. Wenn 
Kinder der Puppe eigene Gefühle anvertrauen und eine enge Bindung eingehen, 
verlieren sie ihre Intimsphäre, da die Puppe diese Informationen an Dritte weitergibt, 
etwa die Eltern. Das Spielzeug war deshalb Gegenstand einer kontroversen Diskus- 
sion in amerikanischen Medien. Jedoch ist das Prinzip das gleiche wie auch bei 
Online-Kaufvorschlägen: Die soziale Identitätsbildung wird durch KI für strategische 
Interessen ausgenutzt. Dies betrifft auch vermeintlich positive Anwendungen von KI, 
wenn z. B. Algorithmen genutzt werden, um über WhatsApp-Chatverläufe depres- 
sive Züge von Kindern und Jugendlichen zu diagnostizieren (RP Online 2017). 
Während KI hier eine gesunde Identitätsbildung unterstützen soll und gleichzeitig 
dem gesellschaftlichen Wert - nämlich dem Schutz von Minderjährigen - Rechnung 
trägt, wird auch der Zweifel genährt, wie weit Schutz gehen darf und wann 
Persönlichkeitsrechte verletzt werden. 
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Die Debatte um den manipulativen Charakter von KI ist jedoch kein Urteil über die 
Technologie als solche. Vielmehr wirft KI Fragen nach Persönlichkeitsrechten und 
informationeller Selbstbestimmung auf. Sie setzt keine Normen um, die nicht sowieso 
bereits in unserer Gesellschaft existieren. Jedoch ist ihr verstärkender Charakter ein 
relevanter Anlass, um persönliche Identität und wie sie in unserer Gesellschaft durch 
Technologie entsteht und sich entfaltet neu zu diskutieren. 


Fazit und Ausblick 


KI besitzt wie keine eine andere Technologie zuvor höchst vielfältige gesellschaftliche 
und ethische Bezüge. Diese ergeben sich vor allem aus der Präsenz in den uns 
bekannten Teilsystemen - von Wertschöpfung über politische Meinungsbildung bis 
hinein in die Freizeit. In all diesen Bereichen bleibt KI nicht neutral und hinterlässt 
Spuren. 


Wirft KI daher neue ethische Fragen auf? Nein. Die wesentlichen Themen der Debatte 
sind nicht grundsätzlich neue ethische Themen. Mit den Fragen nach Verantwor- 
tung, dem sozialen Miteinander oder der individuellen Persönlichkeitsentfaltung 
setzt sich der Kerndiskurs der Ethik fort. Das bedeutet jedoch nicht, dass KI die Natur 
dieser Themen und den Umgang mit ihnen nicht auch verändert, nämlich durch zwei 
Faktoren: 


Erstens erzeugt KI zwar keine grundsätzlich neuen ethischen Fragen, sie verleiht 
ihnen jedoch neues Gewicht und trägt sie in neue Bereiche hinein. So wurden z. B. 
Autonomie und Kontrolle bislang nicht im Kontext von Verkehr und Mobilität disku- 
tiert, ebenso wenig führte der Abschluss eines Abonnements bislang zu der Frage, 
ob sich damit die materielle Identität des Menschen verflüchtigt. Alte ethische Fragen 
werden durch die KI also mit völlig neuen An- und Herausforderungen verknüpft. 


Zweitens und vor allen Dingen potenziert KI ethische Fragestellungen. Das verdeut- 
licht schon die schiere Menge an ethischen Kommentaren sowohl in wissenschaftli- 
chen und institutionellen als auch populären Medien. In diesem Prozess eilt die ethi- 
sche Debatte der technischen Realität oftmals voraus, und so können ethische Impli- 
kationen von Kl zum Gegenstand aktiver politischer und gesellschaftlicher Gestaltung 
werden. 


Die Debatte zur Ethik einer Kl ist also bei Weitem noch nicht erschöpft - nicht in 
qualitativer und erst recht nicht in quantitativer Hinsicht. KI wird den Menschen künf- 
tig immer wieder mit seinen nur allzu oft als selbstverständlich erachteten Werte- 
strukturen konfrontieren und ihn veranlassen, sie zu hinterfragen. Dabei geht es 
eben nicht darum, die technologischen Potenziale der KI zu beschränken, sondern 
ihre potenziellen negativen Auswirkungen auf den Menschen zu reflektieren. Das 
aktuell häufig genannte Argument, KI könne sehr viele, wenn nicht sogar alle Prob- 
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leme irgendwie lösen, kann sich mit Blick auf die möglichen negativen Aus- und 
Einwirkungen auf den Menschen folglich langfristig nicht halten. 


Stattdessen bedarf es einer auf dem ethischen Diskurs aufbauenden proaktiven 
Gestaltung der ethischen und gesellschaftlichen Implikationen von KI, die den aktu- 
ellen technischen in den langfristig erforderlichen ethischen Imperativ einer KI über- 
führt. Gerade mit Blick auf eine innovationspolitisch orientierte Gestaltung gilt es 
dabei folgende Elemente einzubeziehen: 


Antizipation 


KI ist eine Schlüsseltechnologie, die technische Innovationen potenziert, und das in 
unterschiedlichen Gesellschaftsbereichen. Durch strategische und methodisch ange- 
leitete Antizipation (Foresight) kann eine entsprechende Governance technischen 
Realitäten vorgreifen und ethische und soziale Faktoren proaktiv berücksichtigen. 


Reflexion 


KI hat relevante Auswirkungen auf die Gesellschaft - und diese reflektiert dies immer 
kritischer. Sie hält sich den Spiegel vor, indem etwa Medien die Frage aufwerfen, ob 
KI mit bestehenden Werten und Normen vereinbar ist. Ähnlich sollte sich auch die 
Governance der Kl-Forschung den Spiegel vorhalten und regelmäßig fragen, welche 
ethischen und gesellschaftlichen Folgen KlI-Förderung impliziert und wie ihre Gover- 
nance gestaltet werden sollte. Ziel sollte es sein, eine gleiche Ausprägung relevanter 
Normen und Werte zu wahren. 


Transparenz 


Die Mechanismen der KI bleiben für zu viele Außenstehende allzu oft verdeckt. Daher 
brauchen Nutzer mehr Souveränität, die es ihnen ermöglicht, die Funktionsweise der 
KI zu verstehen und Handlungsmuster nachzuvollziehen. Dies betrifft auch den 
Umgang mit und die Nutzung von Daten. Und Gleiches sollte auch für die Gover- 
nance auf systemischer Ebene gelten. Hier ist mehr Kontroverse und Partizipation im 
Vorfeld notwendig als die bloße Konfrontation mit den neuen technologischen Mög- 
lichkeiten und eine anschließende Behebung der Probleme. Zudem können so die 
Akzeptanz gestärkt und ein möglicher Durchsatz von KI letztlich ebenfalls gesichert 
werden. 


Adaptabilität 


KI findet nur dann breite Verwendung und gesellschaftliche Akzeptanz, wenn sie 
anpassungsfähig gegenüber dem Menschen ist. Den Menschen einfach mit den vor- 
gegebenen technologischen Anforderungen der Systeme zu konfrontieren, reicht 
nicht aus. Dass Deutschland sich so schwer tut bei der Digitalisierung macht nur allzu 
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deutlich, dass es eben nicht genügt, entsprechende Kompetenzen nur auszubilden. 
Es gilt: „structure follows user” — und nicht umgekehrt. Was schon vielerorts in der 
Digitalisierung nicht zum Ziele führte, sollte bei einem wachsenden Einsatz von KI 
erst recht vermieden werden. Ein intelligentes System sollte eben gerade durch seine 
Intelligenz in der Lage sein, sich selbstständig auf Situationen oder Menschen einzu- 
stellen und entsprechend zu interagieren. Wie der Mensch Adaptabilität entfalten 
kann, sollte es ein Kl-System auch leisten müssen. Insofern muss es sich stetig weiter- 
entwickeln. 
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13. Kreative Algorithmen für kreative Arbeit? 


Julian Stubbe , Maxie Lutze, Jan-Peter Ferdinand 


Heute gelten Emotionen und Kreativität als menschliche Königsdisziplinen — 
fragt sich nur, wie lange noch. Während das Programmieren von Emotionen 
bereits in den 1990er-Jahren Gegenstand der Kl-Forschung wurde, hat die 
Frage nach künstlicher Kreativität erst in jüngster Zeit durch neue Lernalgo- 
rithmen an Bedeutung gewonnen: Mittlerweile hat ein Algorithmus sogar 
schon einen neuen Rembrandt gemalt! Menschliche Kreativität und mit ihr die 
kulturellen ästhetischen Dinge, die sie hervorbringt, werden zur einer weite- 
ren Messlatte der Kl und eröffnen im gleichen Atemzug ein gänzlich neues 
Feld möglicher Anwendungen - Anwendungen, bei denen sich der Mensch 
bislang sicher sein konnte, im Vorteil zu sein. 


Es gibt viele Gründe, das Innovationsphänomen „künstliche Kreativität“ (KK) zu 
erfassen und hinsichtlich seiner Struktur und seines Anwendungspotenzials zu disku- 
tieren. Zum einen geht es darum zu verstehen, wie maschinelle Prozesse Ergebnisse 
hervorbringen können, die als „kreativ“ gelten, und zum anderen, in welchen Set- 
tings künstliche Kreativität entstehen und angewandt werden kann. Wie kommt 
künstliche Kreativität zustande und wie kann sie genutzt werden? Komplementär zur 
aktuellen akademischen Diskussion, in der diese Frage oftmals untergeht, soll die 
folgende Argumentation das Phänomen der KK in die Arbeitswelt übertragen. Mit 
diesem Schritt wird künstliche Kreativität aus dem akademischen Wetteifern - die 
nächste Stufe menschlicher Alleinstellungsmerkmale mittels Algorithmen zu knacken 
- entkoppelt und hinsichtlich der Anwendungspotenziale in moderner Wissens- und 
Kreativarbeit in den Blick genommen. 


Drei Bedeutungen von Kreativität: anthropologisch, gesellschaftlich, 
wirtschaftlich 


Mit dem Fokus auf Arbeit und Gesellschaft gilt es zunächst einmal zu klären, was 
Kreativität eigentlich ist und welche Bedeutung sie hat. Nicht zufällig wirft der Begriff 
KK oder „Computational Creativity”, wie es im Englischen präziser formuliert wird, 
Assoziationen auf, die nicht rein technischer Natur sind (Stubbe 2017). Drei Bedeu- 
tungszusammenhänge des Begriffs Kreativität sind dabei von besonderer Relevanz: 
ein anthropologischer, ein gesellschaftlicher und ein wirtschaftlicher. 
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Aus anthropologischer Perspektive ist Kreativität als eine Eigenschaft menschlichen 
Handelns zu verstehen. Sie ist die Fähigkeit zu gestalten, Neues zu kreieren sowie 
Probleme zu lösen und Verbindungen zu knüpfen. Der Soziologe Hans Joas sah in ihr 
einen Typ sozialer Aktivität, der sich vom rationalen und normorientierten Tun 
abgrenzte, indem Ziele und Sinn des Handelns erst in einer Situation, im praktischen 
Machen, entstehen, anstatt a priori gesetzt zu sein (Joas 1996). Ähnliches findet sich 
auch beim Anthropologen Claude Levi-Strauss, der im „wilden Denken” eine Art 
sah, wie Menschen durch kreatives Handeln Sinn herstellen. Seine Figur des „Bast- 
lers” ist kreativ, indem er nimmt, was er in seiner Umwelt findet, und damit Instru- 
mente, Technologien oder Kunst schafft (Lévi-Strauss 1973). Aus anthropologischer 
Perspektive erschöpft sich Kreativität nicht in der ästhetischen Qualität künstlerischer 
Werke, sondern wird über den Charakter einer Handlung definiert, die sowohl aus 
situationsgebundener Pragmatik als auch ästhetischem Ausdruck besteht. 


In der gesellschaftlichen Betrachtungsweise prägt der Wert kreativer Produkte den 
Begriff Kreativität. Andreas Reckwitz erkannte, dass in spätmodernen Gesellschaften 
Kreativität sowohl zum subjektiven Begehren als auch zur sozialen Erwartung wird 
- be creative! Die Kunst spiele hierfür eine zentrale Rolle, so Reckwitz. Sie kultiviere 
die Orientierung an Neuheit und Ästhetik und etabliere die Figur des Künstlers als 
„Genie“, dem Schöpfer des Neuen. Kunstwerke werden der individuellen und nicht 
alltäglichen Leistung eines Individuums zugeschrieben, das sich durch seine psychi- 
schen Kapazitäten von der profanen Masse abgrenzt (Reckwitz 2014). Der gesell- 
schaftliche Wert von Kreativität, der insbesondere seit den 1960er-Jahren an Bedeu- 
tung gewinnt, zeigt sich vor allem an der zunehmenden Orientierung am ästhetisch 
Neuen in der Produktion industrieller Güter. Entscheidend für wirtschaftlichen Erfolg 
wird weniger die Stabilität und Langlebigkeit eines Produkts als vielmehr die Fähig- 
keit, neue Reize zu setzen, sich kontinuierlich neu zu erfinden. 


Aus wirtschaftlicher Perspektive geraten die „creative industries” in den Blick. Sie 
sind maßgeblich an der gesteigerten kulturellen Wertschätzung von Originalität, 
Neuheit und Ästhetik beteiligt. Ihre Relevanz für Wertschöpfung und Innovationska- 
pazität projizierte Richard Florida prominent mit dem Begriff der „kreativen Klasse” 
auf eine besondere Gruppe kreativer Menschen (Florida 2003). Ihre Arbeit ist wis- 
sensintensiv, richtet sich stark an Design, Ästhetik und Neuheit aus. Insbesondere für 
Städte sind diese Menschen von großer Bedeutung, denn sie steigern kulturelles 
Kapital und fördern ein erlebnisorientiertes Konsumverhalten. Allerdings, so die 
Kehrseite, verdrängen diese Prozesse auch vorhandene Milieus und Arbeitsstruktu- 
ren. 


Während Florida den Begriff von kreativer Arbeit relativ umfassend anlegt, indem er 
z. B. auch Naturwissenschaftler dort ansiedelt, ist die Bezeichnung Kreativwirtschaft 
enger gefasst. Sie bezeichnet Branchen wie die Musik-, Buch-, Film-, Design- und 
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Werbewirtschaft sowie die Architektur und die Software- und Games-Industrie. Der 
wirtschaftlich verbindende Kern dieser Branchen ist der sogenannte „schöpferische 
Akt”. Darunter versteht man alle Aktivitäten, die den Ausgangspunkt der Herstel- 
lung von Werken, Produkten oder Dienstleistungen bilden (Söndermann et al. 2009). 


Künstliche Kreativität 


KK ist ein Teilaspekt der KI, der im Schnittbereich von Informatik, Psychologie und 
Kognitionswissenschaften, Philosophie und Kunst seit Ende des 20. Jahrhunderts 
einen eigenen wissenschaftlichen Diskurs angeregt hat. Die grundsätzlichen Fragen 
nach den Potenzialen von KI spitzen sich mit Blick auf KK weiter zu, da Kreativität 
noch stärker als Intelligenz mit der menschlichen Fähigkeit verbunden wird, sich neue 
und überraschende Konzepte und Ideen auszudenken und ästhetisch, kulturell oder 
intellektuell wertvolle Artefakte zu erschaffen (Boden 1992). 


In der Auseinandersetzung mit der Frage, in welcher Form und in welchem Ausmaß 
Algorithmen dazu befähigt werden können, eigenständig Ideen und Artefakte zu 
erzeugen, hat sich das konzeptionelle Verständnis von Kreativität ausdifferenziert. So 
stellt Boden (1998) fest, dass Algorithmen zwar durchaus in der Lage sein können, 
Neuheit zu erzeugen, indem sie existierende Informationen kombinieren oder beste- 
hende Wissensbestände austesten. Da kreative Ideen und Artefakte immer auch eine 
positive Selektion erfordern, also beispielsweise als „interessant” oder „wertvoll” 
bewertet werden müssen, Algorithmen ihren eigenen Output jedoch nur schwer 
evaluieren können, stößt künstliche Kreativität hier an Grenzen. 


Zunächst führten die beteiligten Wissenschaftsdisziplinen diese Debatte sehr theore- 
tisch und grundlagenorientiert (Wiggins 2006). Im Zuge der neuesten Fortschritte 
wird Kreativität jedoch zunehmend als praktische Herausforderung begriffen, an der 
sich unterschiedliche Technologien und Ansätze ausprobieren und ihre Potenziale 
unter Beweis stellen können. So werden Domänen wie musikalische Komposition, 
Design, Lyrik und Prosa, aber auch wissenschaftliche Konzeptbildung und ähnliche 
Bereiche, die eine kreative Herangehensweise erfordern, zum Forschungs- und Ent- 
wicklungsgegenstand von KK. Insbesondere konzeptuelle Verbindungen zum 
maschinellen Lernen sorgten dabei für Innovationsimpulse. Über Lernalgorithmen ist 
es möglich, große Datenmengen hinsichtlich wiederkehrender Muster zu analysie- 
ren, um darüber algorithmisch neue, noch nicht abgebildete Entitäten abzuleiten. 
Damit ist für die KK, wie auch für die Kl im Allgemeinen, die Menge und Güte ver- 
fügbarer Daten sehr wichtig bei der Generierung des Outputs. 


Vor diesem Hintergrund bietet sich an, die Rolle des Computers als Kreateur zu 
betrachten und damit, analog zur menschlichen Kreativität, den schöpferischen Akt 
in den Mittelpunkt des Interesses zu stellen. Das Wissenschaftsnetzwerks „PRO- 
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SECCO” definiert KK als „[...] Feld, das Computer nicht auf ihre funktionalen Eigen- 
schaften reduziert, sondern sie in ihrer Rolle als autonome Kreateure und Ko-Krea- 
teure erforscht und nutzt. In einem System künstlicher Kreativität entsteht der krea- 
tive Impuls durch die Maschine, nicht den Nutzer.” 


Der schöpferische Akt von Mensch und Technik 


In dieser Definition künstlicher Kreativität bildet der „kreative Impuls” den Kern und 
die technische Autonomie die Voraussetzung des Phänomens. Damit ähnelt sie der 
menschlichen kreativen Arbeit, dem „schöpferischen Akt”. Wie aber lässt sich die 
neue Beziehung von kreativen Menschen und kreativen Algorithmen differenziert 
beschreiben? 


Eine Möglichkeit ist, beiden, Mensch und KK, die prinzipielle Möglichkeit einzuräu- 
men, Neues zu schaffen. Auf diese Weise kann eine symmetrische Analyse erfolgen, 
wobei die Frage „Wer ist kreativ, Mensch oder Technik?” empirisch beantwortet 
wird. 


Um zu erkennen, wie tiefgreifend eine Neuheit ist, sind folgende drei Stufen des 
schöpferischen Aktes von Menschen wie auch von Computern zu unterscheiden:>® 


Neue Anordnung: Es werden mediale Ausschnitte, Farben oder Klänge strukturiert. 
Kreativität ist die neue Kombination bestehender Inhalte, und es entsteht ein Mög- 
lichkeitsraum für grundlegendere Neuheit. 


Neue Gestalt: Das Alte wird in eine neue Form oder Gestalt versetzt. Die Oberfläche 
erscheint neu, während materielle und technische Eigenschaften erhalten bleiben - 
Dinge werden ästhetisch anders dargestellt. 


Systemische Neuerung: Auf dieser Stufe entstehen grundsätzlich neue Dinge: 
Eigenschaften verändern sich, es entstehen Anwendungen sowie Designs, die neue 
Maßstäbe setzen und Folgeinnovationen auslösen — Systemische Neuerungen sind 
die „Game Changer”. 


In allen drei Fällen beruht die Zuordnung einer Tätigkeit zu einer Stufe weniger auf 
der Struktur innerer kognitiver bzw. algorithmischer Prozesse sondern auf einer 
Bewertung der Produkte. Im Spannungsfeld menschlicher und künstlicher kreativer 
Arbeit assistieren sich Mensch und Technik oder übernehmen leitende Rollen. 


5 Wir danken Jan Korsanke für seinen Vortrag „Al in Design“, der die Ableitung dieser 
Stufen mit inspirierte. Der Vortrag ist abrufbar unter https://de.slideshare.net/JanKorsanke/ 
the-rise-of-ai-in-design-are-we-losing-creative-control-ixds-prework-talk-berlin, zuletzt 
geprüft am 22. Juni 2018. 


iit-Themenband - Künstliche Intelligenz 259 


Mensch 


LEITEND 


ASSISTIEREND 


Abbildung 13.1: Stufen menschlicher und Künstlicher Kreativität (KK) und sich daraus 
ergebende Beziehungen. Leitet der Mensch die Beziehung, liegt der kreative Impuls bei ihm, 
leitet sie die Maschine, liegt der kreative Impuls bei ihr. 


„Spielfelder” künstlicher Kreativität 


Das Thema KK ist zwar nicht mehr jung, aber noch dominiert keine Technologie das 
Innovationsgeschehen und keine Anwendungsgebiete ebnen den weiteren Entwick- 
lungspfad. Vielmehr lassen sich spezifische „Spielfelder” identifizieren, in denen 
Algorithmen Kreativität entwickeln können: Sprache, Musik, visuelle Medien und 
Produktgestaltung. 


Sprache 


Das Spielfeld umfasst schriftlichen Text (Analyse und Generierung) ebenso wie 
gesprochene Sprache (Analyse, Interpretation, Synthese), die in einem kreativen Akt 
generiert und gestaltet werden. 


Die Software „WHIM - What happens if machines” erzeugt fiktive Handlungsstränge 
oder Mini-Erzählungen auf der Basis einer Datenbank von Fakten aus dem Internet. 
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Verarbeitungstechniken für natürliche Sprache invertieren oder verdrehen die Fakten 
und generieren „Was wäre wenn“-Sätze. Die häufig widersprüchlichen Ergebnisse 
wie „Was wäre, wenn es eine Frau gäbe, die wie eine Katze in einer Gasse auf- 
wachte, aber trotzdem Fahrrad fahren konnte?” bewerten Menschen kontinuierlich 
anhand der erzählerischen Güte. Das System lernt so und verbessert die Qualität.°° 


Ein ähnliches Beispiel ist „MetaphorlsMyBusiness”, ein Twitterbot, der Metaphern als 
Tweet hervorbringen und als Webservice in „nüchtern“ kommunizierende Chatbots 
eingebunden werden kann. Dabei wird eine große Wissensbasis stereotyper Normen 
mit realen Nutzungsdaten kombiniert. Die Qualität der Bot-Ausgaben ist laut der 
Forschungsgruppe „ermutigend”. Weitere Ziele sind, dem Bot eine erkennbare 
Ästhetik zu verleihen. Die metaphorischen Vergleiche sollen zum Beispiel mit affekti- 
vem Denken verknüpft werden.°' 


Diese könnten auch für das computerbasierte Verfassen von Gedichten zum Einsatz 
kommen. Verschiedene anerkannte KI-Verfahren werden dafür genutzt (Gervas, 
2013). Die Kombination mehrerer KI-Techniken, um Poesie zu erzeugen, zielt darauf 
ab, menschliche Intuitionen beim Dichten und existierende kognitive Modelle der 
Schreibaufgabe nachzubilden. Dies geschieht, indem intelligente Experten wie auto- 
matisierte Dichter, Evaluatoren und Überarbeiter gekoppelt werden. Das Programm 
„PoeTryMe“ nutzt als Basis Twitter-Tweets, Song- und Prosatexte (Oliveira und Alves, 
2016°%). 


Ein weiteres, sehr komplexes Werk ist der Science-Fiction-Kurzfilm „Sunspring“ von 
dem Regisseur Oscar Sharp. Die KI mit dem Namen „Benjamin“, programmiert von 
Ross Goodwin (New York University), hat das Drehbuch inklusive der Regieanweisun- 
gen geschrieben. Trainiert mit einem Dutzend Science-Fiction-Skripten zerlegt Benja- 
min diese in einzelne Buchstaben und lernt vorauszusagen, welche Buchstaben dazu 
neigen, aufeinander zu folgen, sowie welche Wörter und Phrasen zusammen auftre- 
ten. Abgesehen von Eigennamen kann sie die Drehbuch-Struktur vollständig imitie- 
ren. Trotz einer verworrenen Handlung und teilweise nicht umsetzbaren Regieanwei- 
sungen erhielt der Film auf dem Sci-Fi London Film Festival große Aufmerksamkeit.‘ 


Interessant ist außerdem die Entwicklung der beiden Bots „Alice“ und „Bob“ aus 
Facebooks Forschungslabor für Künstliche Intelligenz (FAIR), die bei dem Versuch, 


6 


© 


http://cordis.europa.eu/result/rcn/167018_en.html, zuletzt geprüft am 22.06.2018 
http://prosecco-network.eu/webservices zuletzt geprüft am 22.06.2018, zuletzt geprüft 
am 22.06.2018 

www. computationalcreativity.net/iccc20 16/wp-content/uploads/2016/01/Poetry-from- 
Concept-Maps.pdf), zuletzt geprüft am 22.06.2018 

https://youtu.be/LY7x2lhgjmc, zuletzt geprüft am 22.06.2018 
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mittels Sprache um Gegenstände zu verhandeln, eine eigene Sprache entwickelt 
haben. Obwohl hier ein schöpferischer Impuls zum Ausdruck kommt, ist der Wert 
der neuen Sprache zunächst unbedeutend, weil die Forschenden diese nicht verste- 
hen können. Gewichtig ist allerdings, dass die beiden Systeme gelernt haben, strate- 
gisch zu lügen, um zu bekommen, was sie wollen. Die Bots können vorgeben, sich 
für ein Objekt zu interessieren, um es später dem anderen zu überlassen. Mit dieser 
„Lügentechnik” können sie folglich den eigentlich begehrten Gegenstand ergat- 
tern.* 


Musik 


Ein Blick in die Harmonielehre zeigt einen grundlegenden Zusammenhang zwischen 
Musik, Mathematik und Harmonie. Im Spielfeld „Musik“ greift KI auf Datenbanken 
mit unterschiedlichen Titeln sowie Informationen über Noten, Klangfarben und 
Rhythmus zurück. 


Die Software „Jukedeck“ komponiert und wandelt die Partituren anschließend in 
Klänge um. Auf einer Webplattform können Genre, Stimmung und Instrumente 
sowie die Geschwindigkeit und Liedlänge definiert werden. Kurze Zeit später steht 
der Titel zum Download bereit und kann entsprechend der Lizenzregelung verbreitet 
oder gekauft werden.‘° 


Das Projekt „Flow Machines” des SONYCSL Research Laboratory hat die beiden 
Songs „Daddy's Car”, im Beatles-Stil, und „Mr Shadow” hervorgebracht. Die KI 
„FlowComposer” kann eine Musikpartitur erstellen, Harmonien in einem bestimm- 
ten Stil oder Variationen einer Melodie erzeugen. Daraus entsteht das erste KI-Album 
des Künstlers - SKYGGE mit dem Titel „Hello World” als Reminiszenz an das erste 
Computer-Programm, das Anfänger beim Erlernen einer neuen Programmiersprache 
schreiben.°® 


Ein weiteres Beispiel ist das Programm „Deepjazz“ von Kim Ji-Sung, das auf einem 


Hackathon in nur 48 Stunden geschrieben wurde. Die KI verwendet zwei Deep Lear- 
ning Bibliotheken, um Jazzmusik zu generieren. Mittels MIDI-Datei (Musical Instru- 
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https://motherboard.vice.com/de/article/qv84p7/ausser-kontrolle-geraten-warum-face- 
book-seine-kunstliche-intelligenz-wirklich-abschalten-musste, zuletzt geprüft am 
22.06.2018 

www.jukedeck.com, zuletzt geprüft am 22.06.2018 

www. flow-machines.com/flowcomposer-composing-with-ai/ und www.helloworldalbum. 
net/about-hello-world/, zuletzt geprüft am 22.06.2018 
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ment Digital Interface) kann ein neuronales Netzwerk trainiert und so eine neue 
Jazzkomposition geschaffen werden.® 


Ob „Deepjazz” oder „Flow Machines”, die neu entstandenen Musiktitel sind nicht 
ohne Weiteres von handproduzierten Werken zu unterscheiden. Teilweise klingen sie 
etwas seltsam, und plötzliche Brüche trüben das Hörerlebnis. Einen gewissen Ohr- 
wurmfaktor haben sie dennoch. Etwas Neues entsteht dadurch, dass die Algorith- 
men nicht nur nach vorgegebenen Mustern eine Melodie erzeugen, was Computer 
schon seit Jahrzehnten können, sondern dass sie lernen, eigenständig neue Kombi- 
nationen und Melodien zu erschaffen - wie ein Musiker, der in einem Studio jammt. 


Visuelle Medien 


Dieses Spielfeld enthält Artefakte, die physisch oder digital festgehalten durch das 
menschliche Auge wahrgenommen werden. 


Wolfgang Beltracchis Fähigkeit, einen neuen Rembrandt zu malen, brachte ihm eine 
Freiheitsstrafe ein. Das Gemälde, das die KI „Next Rembrandt” erzeugte, tourt dage- 
gen seit 2016 durch die Welt. Pinselstrich, Farbauftrag, Lichtdarstellung und auch die 
Rembrandt spezifische Chiaroscuro-Technik, also starke Licht-und Dunkelkontraste, 
die die abgebildete Person bei gleichzeitiger Bildtiefe in den Vordergrund holt, und 
vieles mehr finden Kenner in dieser „Fälschung” wieder. Auf der Basis der Analyse 
von 15 Terabyte Bildmaterial (3 D-Scans und Röntgenaufnahmen) wurden dreizehn 
Farblagen mittels 3 D-Drucker übereinander aufgetragen.°® 


Mit dem Roboter „e-David” gingen Wissenschaftler der Universität Konstanz und die 
Künstlerin Liat Grayver der Frage nach, ob eine Maschine künstlerisches Arbeiten 
erlernen und nicht nur imitieren, also eigene kreative Techniken entwickeln könne. 
Tatsächlich verwandelte „e-David” den Pinselstrich in einen Punkte-Stil, vermutlich 
als Nachahmung von Pixeln. Eigene künstlerische Leistungen sind allerdings noch 
nicht erkennbar.°? 


Ein Beispiel der Videokunst stammt von der britischen Band Muse. Per KI wurden 
Hunderte Stunden Videomaterial nach Wortvorkommen aus dem Text des Songs 
„Dig Down” durchsucht und eine Bibliothek von Videoclips produziert. Die Clips 
werden dann unter Verwendung zeitgesteuerter Informationen aus dem ursprüngli- 
chen Lied zusammengesetzt. Mit diesem Vorgehen entsteht nicht nur ein einzelnes 


67 https://soundcloud.com/deepjazz-ai/sets, zuletzt geprüft am 22.06.2018 
68 httos://www.nextrembrandt.com, zuletzt geprüft am 22.06.2018 
& http://graphics.uni-konstanz.de/eDavid/, zuletzt geprüft am 22.06.2018 
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Abbildung 13.2: Next Rembrandt Abbildung 13.3: Von e-David erzeugtes Bild (e-David 
(ING and J. Walter Thompson Selbstportrait Liat Grayver und Oliver Deussen, 
Amsterdam) Universität Konstanz, wwvw.e-david.org) 


Video. Der Vorgang wird jeden Tag wiederholt, sodass derselbe Titel täglich mit 
einem neuen passenden Video zu sehen ist.’° 


Ein neues Werk ist der Film-Trailer des Horror-Thrillers „Morgan“, den IBMs Watson 
herstellte. Gewissermaßen als Werkzeug hilft Watson, die Visuals anzuordnen. Es 
braucht dabei immer noch die menschlichen Eingaben - den Film. Das Originelle 
ergibt sich hier wieder durch die Neu-Komposition vorhandener Inhalte.” 


Vielfach sind kreative Menschen symbiotische Beziehungen mit neuen Technologien 
eingegangen. Es entstanden künstlerische Ausdrucksformen wie beispielsweise das 
VJing. Der Berliner Künstler Roman Lipinski arbeitet mit der Kl „Roman“ (Artificial 
Intelligence Roman, AIR), die Merkmale wie Komposition, Farben und Formen seiner 
Werke analysiert und davon abgeleitet Neu-Kompositionen kreiert. Von diesen lässt 
sich der Künstler wiederum inspirieren. So wird die KK zur Muse.’? 


In einer Welt kreativer Maschinen, die Kunst schaffen, ist auch die Kuration von 
Bedeutung. Der elektronische „Kurator-Computer” verfolgt das Ziel, Kunst nicht nur 


79 http:/lai.muse.mu/, zuletzt geprüft am 22.06.2018 

71 www.ibm.com/watson/advantage-reports/future-of-artificial-intelligence/ai-creativity.htmi, 
zuletzt geprüft am 22.06.2018 

72 https./llisa.gerda-henkel-stiftung.de/night_of_artificial_creativity_teil_2?nav_id=6769, 
Minute 16:32 bis 33:40, zuletzt geprüft am 22.06.2018 
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zu erzeugen, sondern auch deren Qualität zu bewerten. Im Dialog - gewissermaßen 
dem künstlerischen Prozess - zwischen zwei konkurrierenden neuronalen Netzwer- 
ken werden ein Maler und ein Kurator repräsentiert. Durch gemeinsames Training 
der Netzwerke verbessert sich jedes der beiden in seiner eigenen Aufgabe. In diesem 
spezifischen Fall lernt das Maler-Netzwerk Pflanzen-Porträts aus Gesichtsbildern zu 
erstellen, das Kurator-Netzwerk, die Kreation des Malers zu bewerten. Das Training 
erfordert eine Reihe von Gesichtsbildern und Gemüsegesichtern aus dem Internet. 
Der Maler analysiert ein menschliches Antlitz und verwandelt es in Echtzeit in ein 
pflanzliches Gesicht. Der „Kurator” bewertet das Ergebnis und erzeugt einen kurati- 
ven Text.” 


Allen Beispielen gemein ist die Impulsgebung bei der Gestaltung des Artefakts. Die 
Abbildung neuer Bildmotive („Next Rembrandt”) oder neue Anreihungen von Video- 
clips sind originell und in der Form bisher nicht dagewesen. Auch im Falle von AIR 
gelingt es, ansprechende und gewohnt gute Bilder zu produzieren. Dennoch sind sie 
in weiten Teilen einfach sehr gute Nachahmungen, die bekannte Stilmittel der Kunst, 
wie Zerstörung des Gewohnten oder Regelbrüche, allerdings bisher nicht tangieren. 
Auch neue Stile, das legt „e-David” nahe, entspringen daraus aktuell nicht. 


Produktgestaltung 


Das Spielfeld umfasst das Design und die Herstellung materieller Gegenstände als 
kreative Tätigkeit. KK ist hier eng gekoppelt mit dem Einsatz von 3D-Planungssoft- 
ware sowie additiven Fertigungstechnologien. 


Für die Planung von Gegenständen reichen grobe Raster, wie z. B. das Gerüst einer 
Drohne, welches vier Aufhängungen für Propeller und ein Chassis für Steuerungs- 
technik benötigt. Der Designer Eli D'Elia hat mittels der KK eine Drohne entworfen, 
bei der lediglich die rudimentären Anforderungen festgelegt waren, während das 
Chassis-Design gänzlich vom Algorithmus stammt. Das Resultat ist ein idealer Kom- 
promiss zwischen Flugeigenschaften und Stabilität - mit erstaunlichen Ähnlichkeiten 
zu den Beckenknochen eines Flughörnchens.’* 


Ein ähnliches Beispiel stammt aus einer Forschungskooperation des Softwareunter- 
nehmens Autodesk mit Airbus. Hier wurde unter dem Titel „Generative Design” ein 
Algorithmus eingesetzt, um Trennwände für Flugzeugkabinen zu entwerfen. Vorge- 
geben waren nur die groben Anforderungen hinsichtlich der äußeren Form, während 


73 https: //\www.youtube.com/watch?v=4sZsx4FpMxg&feature=youtu.be, zuletzt geprüft am 
22.06 2013 

74 http://www.core77.com/posts/57167/A-Drone-on-its-Own-Using-Al-to-Design-and-Fly-a- 
UAV, zuletzt geprüft am 22.06.2018 
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Abbildung 13.4: Softwaregenerierte Kabinentrennwand (Courtesy of The Living, an Auto- 
desk Studio © 2018 Autodesk, Inc.) 


der Algorithmus die gesamte innere Struktur der Trennwand erzeugte. Resultat war 
ein bionisches Design, das stabiler ist als herkömmliche Trennwände, und das bei 
halbem Gewicht.” 


Eine weitere Kooperation ist Autodesk mit dem Motorsportunternehmen Bandito 
Brothers eingegangen, um ein ideales Chassis für einen Rennbuggy zu konstruieren. 
Hierzu rüsteten die Entwickler ein Fahrwerk mit Sensoren aus, um die Belastungs- 
schwerpunkte im Renneinsatz zu messen. Die resultierenden Daten verarbeitete eine 
Software, um ein optimales Chassis-Design zu entwerfen. ’® 


73 https://www.autodesk.de/customer-stories/airbus, zuletzt geprüft am 22.06.2018 
7e httos://www.autodeskresearch.com/blog/when-iot-meets-generative-design-cars, zuletzt 
geprüft am 22.06.2018 
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Abbildung 13.5: 3D-gedruckte Brücke (Foto: MX3D) 


In ähnlicher Weise hat das „Smart Bridge Project” zum Ziel, eine computergenerierte, 
funktionstaugliche Brücke in Amsterdam zu drucken. Deren Design ist nicht festge- 
legt, sondern von einem Algorithmus entworfen. Das Bauwerk wird dann von zwei 
mit 3D-Druckern ausgerüsteten Roboterarmen direkt vor Ort am Amsterdamer Kanal 
produziert. Neben der Stabilität spielt auch die Ästhetik eine gravierende Rolle. In den 
ersten Prototypen entwarf der Algorithmus einen feinstrukturierten und geschwun- 
genen Brückenkorpus. Die endgültige Version soll aus Stahl gedruckt werden.” 


Künstliche Kreativität und der Wandel kreativer Arbeit 


In allen Spielfeldern ergeben sich nicht allein technische, sondern auch gesellschaft- 
liche und ethische Fragen. Kreativität und Innovation sind geradezu per Definition 
mit Verdrängung verbunden; wo etwas Neues entsteht, muss etwas Altes weichen. 
Ob KI im Allgemeinen Jobs schafft, verdrängt oder verändert, wird heftig diskutiert. 
Im Hinblick auf KK muss die Debatte jedoch die spezifische Konstellation von Tech- 
nik, gesellschaftlicher Affinität zum Neuen und der sozialen Gruppe der Kreativen in 
Betracht ziehen. 


Die Gruppe der Kreativen, denen die KK potenziell Konkurrenz macht, ist anders als 
die der Arbeitnehmer im fertigenden Gewerbe oder in der Sachbearbeitung, die 


77 http:lImx3d.com/smart-bridge/, zuletzt geprüft am 22.06.2018 
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Mensch 


PRODUKTGESTALTUNG 


VISUELLE MEDIEN 


SPRACHE 


Abbildung 13.6: Potenzial von KK in den Spielfeldern Sprache, Musik, visuelle Medien und 
Produktgestaltung 


bislang im Fadenkreuz der Automatisierung standen. Wie von Florida ausgeführt, 
bringen die Kreativen Innovationen im Allgemeinen sehr wirksam voran. Während 
Arbeit in Produktion und Sachbearbeitung anhand einer Lasterfüllung bemessen 
wird, schafft kreative Arbeit Neuheit, die günstig für Innovationen ist. In Bezug auf 
Technik sind Kreative häufig nicht allein frühe Nutzer, vielmehr sind sie auch Mit- 
Entwickler, weil sie aufgrund ihrer Neugier und Technologieaffinität in neue Anwen- 
dungsgebiete vorstoßen. Sie sind daran beteiligt zu definieren, was überhaupt als 
„kreativ“ gilt. KK können sie folglich als Werkzeug einsetzen, um schneller und pro- 
fessioneller kreative Ergebnisse zu erzielen, auch ein gesteigertes Spektrum an Aus- 
drucksformen kann daraus resultieren. 


Die Beispiele zeigen, dass KK zu einem weiteren Innovationsfeld für die etablierten 
Player im Kl-Bereich wird. IBM, Google und Co. haben die möglichen Potenziale von 
KK erkannt und versuchen für ihre entsprechenden Schlüsseltechnologien, wie z. B. 
„Watson“, Anwendungen zu finden. Der Einsatz dieser Technologien ermöglicht 
zweierlei: Sie hilft dabei, die menschliche Wahrnehmung besser zu verstehen sowie 
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neue Erkenntnisse durch KI für die Gestaltung von Produkten und neuen Geschäfts- 
modellen zu verwerten. 


Bei der Vielzahl kreativer Tätigkeitsbereiche ist davon auszugehen, dass sich KK 
unterschiedlich intensiv auf Arbeitsroutinen auswirken wird. Gemessen am wirt- 
schaftlichen Interesse der großen und entwicklungstreibenden Technologie-Kon- 
zerne ist davon auszugehen, dass KK zunächst dort zum Zuge kommt, wo die kom- 
merziellen Verwertungschancen des kreativen Outputs am größten sind. 


Es ist daher zu erwarten, dass sich die kreative Arbeit in den skizzierten Spielfeldern 
jeweils unterschiedlich verändern wird: 


„Sprache kann mit KK durchmischt werden, neue Bedeutungen werden jedoch vom 
Menschen geschaffen.” 


Betrachtet man die Beispiele im Spielfeld „Sprache“ durch das analytische Raster aus 
Abbildung 3.4.1, sind diese vornehmlich in der unteren, linken Ecke zu verorten. Für 
„WHIM”, „MetaphorlsMyBusiness”, „PoeTryMe” oder „Sunspring” muss der 
Mensch jeweils einen relativ präzisen Möglichkeitsraum definieren, damit kreative 
Ergebnisse produziert werden können. Deutlich wird, dass mittels KI Phrasen, Worte 
und Buchstaben nach bestimmten Strukturen und Mustern neu angeordnet werden 
können. Dabei können zwar Kombinationen entstehen, die sich in der gleichen Form 
noch niemand ausgedacht hat und die originell sind, eine kreative Qualität, die auch 
in einem wirtschaftlichen Produktionsprozess relevant ist, entsteht hier jedoch nicht 
bzw. erst, wie im Beispiel von „Sunspring”, unter gestaltender Leitung des Men- 
schen. 


„KK kann neue Musik erzeugen, diese sind jedoch gefällig und gehen nicht über 
bekannte Formen hinaus.” 


Musik unterscheidet sich wesentlich von Sprache, weil ihr Sinn nicht über eine 
begriffliche Bedeutung vermittelt wird, sondern durch eine ästhetische Erfahrung. 
Damit kann Musik neu angeordnet werden, und es entsteht vergleichsweise einfach 
ein sinnvoller Zusammenhang, weil etwas gut klingt. Damit hat KK das Potenzial, 
Neuerungen zu schaffen, die Menschen als sinnvoll bewerten. Wenn also Menschen 
einen Wirkungsraum festlegen, kann die KI eigenständig kreieren und dabei noch 
nicht Bekanntes hervorbringen. Die bisher geläufigen Ergebnisse eignen sich z. B. als 
Untermalung von Werbung oder für Einkaufserlebnisse in Shopping-Centern. Hier 
sind sie vor allem auch dann interessant, wenn entsprechende GEMA-Gebühren ver- 
mieden werden können. 


„Mit KK können visuelle Medien schneller gut aussehen, ein neues ‚Genie’ ist die 
KK jedoch nicht.” 
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Die Beispiele im Spielfeld „visuelle Medien“ zeigen, dass KK kreative Arbeit deutlich 
verändern kann. Zum Teil verändert sich die Rolle des Menschen dabei: im Produkti- 
onsprozess kann der Mensch vom Schaffenden zum Bewerter wie im Beispiel „Next 
Rembrandt“ oder zum Verwerter wie beim Beispiel „AIR“ werden. Kurzfristiger und 
zunächst gravierender ist jedoch die Geschwindigkeit, mit der etwas Neues hervor- 
gebracht werden kann. Dass ein Musikvideo binnen Stunden neu generiert werden 
und dabei einen Überraschungseffekt beim Betrachter erzeugen kann, ist möglicher- 
weise nicht im künstlerischen Sinne, wohl aber im Hinblick auf die werbende Wir- 
kung von Musikvideos und die wirtschaftliche Struktur ihres Produktionsprozesses 
von Bedeutung. Ähnliches gilt für die Kl-gestützte Anwendung von visuellen Filtern, 
die Bilder in kürzester Zeit bearbeiten inkl. eines, unter Umständen kurzweiligen, 
Neuheitseffekts. In diesem Spielfeld steht die Gruppe der Kreativen somit vor einer 
Aufgabe, die sie gewöhnt ist: sich neue Technologien anzueignen und diese schnell 
innerhalb eines gegeben Produktionsprozesses anzuwenden. 


„Die kreative Verarbeitung von Werkstoffen in der Produktgestaltung wird durch 
KK grundsätzlich erneuert: Algorithmen bewältigen das Spannungsfeld zwischen 
materiellen Anforderungen und Ästhetik; sie führen den Menschen zu neuen Desig- 
nprinzipien.” 


In der Produktgestaltung entfaltet KK die bislang stärkste Wirkung und lässt ihre 
Potenz aufscheinen, systemische Neuerungen zu schaffen. In den Beispielen liegt der 
schöpferische Akt des Designs beim Algorithmus, während der Mensch lediglich den 
Möglichkeitsraum absteckt und Informationen anordnet. Diesen Raum „erkunden“ 
die Algorithmen. Daraus gehen Entwürfe hervor, die sich Menschen allein so nicht 
hätten ausdenken könnten. Insbesondere das Beispiel des Autochassis zeigt, dass die 
Güte der Entwürfe mit der Qualität der Daten ansteigt. Wenn ein Computer mehr 
Input erhält, entstehen für ihn auch mehr Möglichkeiten. Auf Grundlage dieser 
Bedingungen können Algorithmen Entwürfe entwickeln, deren Neuheit weit über 
die Gestaltung von Oberflächen hinausgeht. Der Mensch wird hier zum Zuarbeiter 
und ordnet Informationen an, die dann den Rahmen bilden, in dem die Technik sys- 
temische Neuerungen und gänzlich neue Lösungswege sowie ästhetische Prinzipien 
schafft. Das Spannungsfeld zwischen materiellen Anforderungen und Ästhetik, das 
in diesem Spielfeld besonders ausgeprägt ist, begünstigt die Eingriffstiefe der KK. 


Bedingungen für Künstliche Kreativität 


Alle Spielfelder entwickeln sich nicht losgelöst von allgemeinen gesellschaftlichen 
Trends sowie materiellen und kulturellen Bedingungen. Dabei lassen sich einige 
Punkte, die die Durchsetzung von KK unterstützen, zusammenfassen: 
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Die Bedeutung von kreativer Arbeit wächst in allen Feldern mit dem gesellschaftli- 
chen Trend zur Individualisierung, der die Orientierung an neuen, besonderen und 
exklusiven Produkten nährt. 


Die technischen Voraussetzungen zur Implementierung von KI sind bereits dann aus- 
sichtsreich, wenn kreative Arbeit stark technisch geprägt ist. Künstliche Kreativität 
öffnet hier die Möglichkeit, kreative Kompetenzen stärker zugunsten des Computers 
aufzuteilen. 


Über Qualität wird die Kreativbranche intensiver diskutieren: Als Bewertungsraster 
für die Sinnhaftigkeit des Ergebnisses zieht KK Wahrscheinlichkeiten heran. Offen ist, 
inwiefern man langfristig einen computerbasierten Output als kreativ bezeichnen 
kann oder eher ein Massengeschmack angesprochen wird. 


Der Konkurrenzdruck unter Kreativdienstleistern ist hoch, sodass Unternehmen nach 
neuen Wettbewerbsvorteilen suchen. Für die Produktionsprozesse kreativer Arbeit 
bedeutet dies hohe Anforderungen an Geschwindigkeit, bei gleichzeitig hohen 
Ansprüchen an Design und technischer Funktionalität. 


Die Branchen bestehen aus vielen kleinen und mittleren Unternehmen, deren Arbeits- 
prozesse flexibel sind und die neue Technologien schnell aufgreifen und implemen- 
tieren können. 


Die Kreativarbeit ist aufgrund ihrer Kultur eine Spielwiese, auf der neue Sachen aus- 
probiert werden können. So lassen sich neue Konstellationen assistierender und/oder 
leitender Zusammenarbeit von Menschen und Algorithmen prototypisch erproben 
und in andere Tätigkeitsbereiche übertragen. 
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Ausblick 
Volker Wittpahl 


Viele Kl-Entwicklungen und -Anwendungen sind schon vom Status einer technolo- 
gisch basierten Idee in alltagstaugliche Anwendungen überführt worden. Dieser 
Umstand ist ebenso unabänderlich wie die Tatsache, dass die Entwicklung der KI- 
Technologie rasant weiter voranschreiten wird. Sie lässt sich nicht aufhalten oder 
wieder zurückdrängen. Treiber hierfür — im positiven wie im negativen Sinne - sind 
unter anderem globale Wirtschaftsakteure, die getrieben von Profit und Effizienz 
agieren. 


Während der technologische Ausblick sicher ist, gibt es zur Weiterentwicklung der 
Kl-Technologie noch viele Fragen, die offen sind. Im Bereich der Hardware-Entwick- 
lung für KI-Systeme gibt es aktuell verschiedene Ansätze, die parallel verfolgt wer- 
den. Ein Ansatz ist, die optischen Computer als Hardware-Basis für KI-Systeme zu 
entwickeln (Meier 2018). Ein weiterer Ansatz ist die Entwicklung von neuromorpher 
Hardware (Honey 2018). Noch völlig offen ist die Frage, welches Potenzial sich 
erschließen lässt, wenn sich in einigen Jahren Quantenrechner für KI-Systeme nutzen 
lassen. 


Europäische Stärken nutzen 


Nicht nur die Entwicklungsrichtung der Kl-Technologie ist offen, sondern auch die 
globale Technologieführerschaft. Die bislang gesetzten Favoriten sind China und die 
USA. Selbst wenn die USA bei gefühlter Technologieführerschaft derzeit die Nase 
vorne haben sollten, besitzt China einen Vorteil, der mittelfristig die Technologie- 
führerschaft sichern wird: die Trainingsdaten. 


Verglichen mit den USA hat China schon dreimal so viele Internet- und Smartphone- 
Nutzerinnen und Nutzer. Außerdem zahlt in China kaum noch jemand mit Bargeld, 
sondern fast ausschließlich mittels Smartphone. Hinzu kommen noch weitere sensor- 
basierte Umwelt- und Verkehrsdaten. So erzeugen Leihräder mit täglich 50 Millionen 
Fahrten 30 Terabyte an Daten pro Tag, was 300 Mal so viele sind wie in den USA. 


Vor diesem Hintergrund stellt sich die Frage: Welche Chancen haben wir als Europäer 
auf globaler Ebene im Kl-Bereich? Statt der Technologieführerschaft kann ein Ansatz 
die starke Ausrichtung auf Sicherheitsaspekte und hohe Standards sein, die Europa 
ähnlich wie im Fall des Datenschutzes eine positive Differenzierung im wirtschaftli- 
chen Kontext erlaubt. 
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Grenzen definieren 


Das Thema KI scheint umso mehr Fragen aufzuwerfen, je tiefer man in die Technolo- 
gie und ihre Potenziale einsteigt. Was wird in Zukunft als wahrhaftig gelten, wenn 
beispielsweise Stimmen, Bilder und Nachrichten von KI-Systemen nach Belieben ver- 
ändert werden können? 


Zentral für die Nutzung von KlI-Systemen in Zukunft wird eine Frage sein, die sich 
Organisationen, Gesellschaften und Individuen immer wieder stellen müssen: Wel- 
che Entscheidungen geben wir an die Kl ab und welche Entscheidungen können und 
wollen wir nie an die KI abgeben? 


Offen ist die Frage, wie KI-Systeme von Arbeitgebern eingesetzt werden dürfen. So 
nutzen große Firmen wie IBM, General Eletric oder Facebook KI für den Auswahlpro- 
zess von Mitarbeiterinnen und Mitarbeitern. Dazu erstellt eine KI Persönlichkeitspro- 
file und bewertet Arbeitsbeispiele. Bei Bewerbungsgesprächen werden mittels Skype 
oder Kameras vor Ort Gesichtsausdruck, Sprachwahl, Motivation oder Engagement 
der Bewerberinnen und Bewerber mittels KI beurteilt. Inzwischen arbeiten Firmen 
auch daran, mittels kontinuierlicher Datenanalyse von internen und öffentlichen 
Informationen die besten und die schlechtesten Mitarbeiterinnen und Mitarbeiter zu 
identifizieren (Volland 2018). 


Eine weitere Herausforderung ist die Manipulation mittels Kl. Liesl Yearsley, die ehe- 
malige Geschäftsführerin der Firma Cognea, die Chat-Bots entwickelt, konnte für 
ihre Firmenkunden dafür sorgen, dass Chat-Bot-Nutzer ein bestimmtes Produkt kau- 
fen und sich die Verkaufzahlen für die Firmenkunden so verdoppelten (ebd.). Inzwi- 
schen können KI-Systeme aus den Daten einer Gesichtserkennung mit Mimik-Ana- 
lyse sowie mithilfe einer Stimmanalyse nach Höhe und Vibration unseren Gemütszu- 
stand erkennen und jede Regung bestimmen (ebd.). Aber dürfen die Gemütszustände 
von Nutzerinnen und Nutzern, die von Kl-Systemen anhand von Sprachdaten erfasst 
werden, in emotionale Nutzerprofile münden? Falls ja, wie dürfen diese Profile ein- 
gesetzt und verwendet werden? Falls nein, wie wird die Erstellung derartiger emoti- 
onaler Nutzerprofile verhindert? 


Internationale Leitlinien voranbringen 


Im Jahr 2017 brachte ein offener Brief an die UN vom „Future of Life Institute” die 
Furcht vor den Risiken von künftigen autonomen Waffensystemen zum Ausdruck. 
Dieser Brief wurde unterschrieben vom Chef der Firma DeepMind, Elon Musk, dem 
deutschen KI-Experten Jürgen Schmidhuber und vielen weiteren (ebd.). In diesem 
Sinne wäre ein Lösungsansatz für viele Fragen im Kontext der Kl eine Magna Carta 
für das digitale Zeitalter. Sie könnte beispielsweise die Konstitutionalisierung einer 
globalen Multi-Stakeholder-Institution zu Kl-Governance als Ziel haben (KAS 2018). 
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KI ist dabei nie losgelöst zu betrachten, sondern muss immer in Kombination mit 
einem Anwendungssystem gedacht werden. Schaut man sich die Kombination Kl 
und Robotik an, zeigen Videos von Boston Dynamics, wie schnell Maschinen auch 
komplexe Bewegung mithilfe von Kl-Systemen gelernt haben. Beim Betrachten der 
Videos mag der ein oder andere „Oh mein Gott! “-Ausruf mit einem leichten Schau- 
der verbunden sein, wenn man weiß, dass ein Großteil der Entwicklungsgelder vom 
Militär stammt. 


Da man nicht davon ausgehen kann, dass der gesellschaftliche Diskurs schneller 
abgeschlossen werden kann als die Kl-Technologie sich weiterentwickelt, ist die Ein- 
führung eines Ethik-Kodex für Kl-Entwicklerinnen und -Entwickler eine mögliche (auf 
jeden Fall aber notwendige) Zwischenlösung, um die Übergangszeit der Kl-Entwick- 
lungen unbeschadet zu überleben. 


Den eigenen Ansatz finden 


Ignoranz ist keine Lösung für die Zukunft, daher sollte jeder Mensch KI-Entwicklun- 
gen aufmerksam verfolgen und beobachten. Wer für sich die nächste „Oh mein 
Gott”-Entwicklung von KlI-Systemen entdeckt, sollte diese in die Zukunft weiterden- 
ken, sei es in die Breite der Anwendungen oder in die Masse der Anwenderinnen und 
Anwender, und sich die möglichen Auswirkungen bewusst machen. In diesem 
Gedankenexperiment ist kein „Das kann ich mir nicht vorstellen“ und kein „Das wird 
nie passieren” zugelassen. Abhängig vom persönlichen Fazit ist Stellung zu beziehen 
und ggf. aktives oder gestalterisches Handeln geboten. 


Wichtig für die Diskussion ist: Erlauben wir uns, weiße und schwarze Kl-Anwendun- 
gen für die zukünftige Welt zu denken - und zu hoffen, dass die Entwicklung der 
Zukunft sich irgendwo in der Mitte zwischen den Extremen wiederfindet. 
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Dr. Dana-Kristin Mah 


Dana-Kristin Mah ist fachliche Beraterin in der VDV/ VDE-IT im Bereich Bildung und 
Wissenschaft. Aktuell fokussiert sie sich auf die Digitalisierung von (Hochschul-JBil- 
dung. Zuvor hat sie als wissenschaftliche Mitarbeiterin an der Universität Potsdam 
und der Technischen Universität Berlin zu Themen wie Studieneingangsphase, Hoch- 
schuldidaktik und Kompetenzentwicklung geforscht und gelehrt. In ihrer Promotion 
untersuchte sie akademische Kompetenzen von Studienanfängern und das Potenzial 
von Bildungstechnologien (Learning Analytics und Digital Badges) für einen erhöhten 
Studienverbleib. 


iit-Themenband - Künstliche Intelligenz 281 


Dr. Axel Mangelsdorf 


Axel Mangelsdorf ist promovierter Innovationsökonom und seit 2017 als Berater für 
die VDI/VDE-IT tätig. Er arbeitet schwerpunktmäßig in normungs- und standardisie- 
rungsbezogenen Projekten. Vor seiner Zeit bei der VDI/VDE-IT arbeitete Axel Man- 
gelsdorf als wissenschaftlicher Mitarbeiter und Berater für die Welthandelsorganisa- 
tion und die Weltbank. 


Dr. Stephan Otto 


Stephan Otto studierte Lehramt für Gymnasium und Gesamtschulen für die Fächer 
Deutsch, Geschichte und Erziehungswissenschaften. Er wurde über eine Arbeit 
zu Schulpraktika in der Lehrendenbildung promoviert. Seit 2017 ist er bei der 
VDI/VDE-IT als wissenschaftlicher Mitarbeiter beschäftigt und in den Projektträger- 
schaften Digitale Hochschulbildung und Digitaler Wandel tätig. Zuvor war er wissen- 
schaftlicher Mitarbeiter an der Universität Duisburg-Essen und dort u. a. in die Kon- 
zeption und Durchführung von innovativen Lehrveranstaltungen für angehende 
Lehrkräfte involviert. 


Prisca Paulicke 


Prisca Paulicke ist fachliche Beraterin für die Digitalisierung der Bildung. Seit mehre- 
ren Jahren beschäftigt sie sich mit komplexen digitalen Lern- und Trainingsinfrastruk- 
turen in Wirtschaft und Wissenschaft. Ihr Fachgebiet ist die Identifikation von Bedar- 
fen, Entwicklung von neuen Trainingskonzepten sowie die systemische Prozess- und 
Produktentwicklung. Das von ihr entwickelte mehrperspektivische Videosetting 
„Multiview” wird heute vielfach in der Lehrerbildung eingesetzt. Aktuell wurde sie 
gemeinsam mit dem Institut für Informatik der Universität Potsdam im Wettbewerb 
„Gelungene VR/AR-Lernszenarien 2018” ausgezeichnet. 


Kai Priesack 


Kai Priesack ist Wirtschaftsingenieur und arbeitet schwerpunktmäßig zu arbeits-, 
innovations- und technologiepolitischen Fragestellungen. Seit 2017 ist er Berater im 
Bereich Demografie, Cluster und Zukunftsforschung, wo er unter anderem im Auf- 
trag des Bundesministeriums für Arbeit und Soziales (BMAS), des Sächsischen Staats- 
ministeriums für Wirtschaft, Arbeit und Verkehr (SMWA) und des Büros für Technik- 
folgen-Abschätzung beim Deutschen Bundestag forscht und berät. Davor war Kai 
Priesack wissenschaftlicher Mitarbeiter am Lehrstuhl für Angewandte Mikroökono- 
mik an der Humboldt-Universität zu Berlin. 
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Dr. Marieke Rohde 


Marieke Rohde arbeitet seit 2018 bei der VDI/VDE-IT (Bereich Gesellschaft und Inno- 
vation) als Datenwissenschaftlerin und als Beraterin für Kl, Robotik und Machine 
Learning in der Begleitforschung zu Technologieförderprogrammen des BMWi. Von 
2016 bis 2017 war sie Teil des Gründerteams des KI-Start-ups Affective Signals 
GmbH, in dem sie ein Online-Verhandlungstraining aufgrund intelligenter Analyse 
nichtverbaler Sprachsignale aus Ton- und Bilddaten entwickelte. Davor arbeitete sie 
vierzehn Jahre in der akademischen Forschung (Robotik, Kl, Kognitive Neurowissen- 
schaft) im In- und Ausland. Sie hat mehr als 20 internationale Fachpublikationen 
veröffentlicht. 


Dr. Antonia Schmalz 


Antonia Schmalz studierte Physik und promovierte 2012 am Max-Planck-Institut für 
Quantenoptik. In der Münchner Geschäftsstelle der VDI/VDE-IT arbeitet sie als wis- 
senschaftliche Mitarbeiterin in verschiedenen Projektträgerschaften rund um das 
Thema „Elektronische Systeme”, unter anderem mit dem Schwerpunkt „Electronic 
Design Automation”. 


Dr. Markus Schürholz 


Markus Schürholz studierte Physik und promovierte im Bereich Neurowissenschaft 
zur automatisierten Analyse von Hirnsignalen in Brain-Computer-Interfaces. Seit 
2014 ist er als Berater bei der VDI/VDE-IT tätig, begutachtet Innovationsvorhaben 
und begleitet staatlich geförderte Forschungs- und Entwicklungsprojekte in den 
Bereichen Interaktions- und Gesundheitstechnologien. Er berät das Bundesministe- 
rium für Bildung und Forschung zum Themenkomplex Mensch-Technik-Interaktion. 


Dr. Eike-Christian Spitzner 


Eike-Christian Spitzner wurde 2012 an der Technischen Universität Chemnitz im Fach 
Experimentalphysik promoviert. Seine Forschungsschwerpunkte lagen in der chemi- 
schen Physik und der Entwicklung neuer Methoden zur Oberflächenanalyse auf der 
Nanometerskala. Seit 2014 ist er wissenschaftlicher Mitarbeiter bei der VDI/VDE-IT im 
Bereich Elektronik- und Mikrosysteme und befasst sich dort im Rahmen einer Projekt- 
trägerschaft für das BMBF unter anderem mit dem Themengebiet der Leistungselek- 
tronik. 
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Dr. Julian Stubbe 


Julian Stubbe ist seit 2017 als Berater in der VDI/VDE-IT im Bereich Demografischer 
Wandel, Cluster und Zukunftsforschung tätig. Zuvor promovierte er an der Techni- 
schen Universität Berlin im Graduiertenkolleg „Innovationsgesellschaft heute”, wo er 
sich mit Fragen gesellschaftlicher, wissenschaftlicher und künstlerischer Innovationen 
auseinandersetzte. Er veröffentlichte Aufsätze und eine Monographie zu Themen 
wie der gesellschaftlichen Bedeutung von Technologie und Kreativität sowie zu 
methodischen Fragen der Innovationsforschung. 


Robert Thielicke 


Robert Thielicke ist Diplom-Biologe, Ethnologe und seit 15 Jahren Wissenschaftsjour- 
nalist. Er arbeitete zehn Jahre lang für das Nachrichtenmagazin Focus, zuletzt als 
Redakteur für besondere Aufgaben. Seit Herbst 2012 ist er Chefredakteur von Tech- 
nology Review, der deutschen Ausgabe der MIT Technology Review des US-amerika- 
nischen Massachusetts Institute of Technology. Das Magazin ist führend in der 
deutschsprachigen Innovations-Berichterstattung und veranstaltet mit den „Innova- 
toren unter 35” sowie den „Innovators Summits” wichtige branchenübergreifende 
Events. 


Dr. Martin Waldburger 


Martin Waldburger verfügt über einen Abschluss als Diplom-Informatiker (Richtung 
Wirtschaftsinformatik) der Universität Zürich, wo er 2011 zu internationalen Verträ- 
gen im Internet promovierte und bis 2013 als Oberassistent (Postdoc) arbeitete, 
bevor er nach Deutschland zog und bei WIK-Consult als Senior Consultant tätig war. 
Seit 2016 arbeitet er bei der VDI/VDE-IT als wissenschaftlicher Mitarbeiter und Bera- 
ter. Er leitet die Projektträgerschaft „Modernitätsfonds” (mFUND) zu datengetriebe- 
nen Innovationen in der Mobilität und betreut FuE-Projekte zu Datenschutz und Pri- 
vatheit in der digitalen Welt. 


Dr. Leo Wangler 


Leo Wangler ist iit-Experte im Schwerpunkt Klima und Energie im Bereich Systemin- 
novation. Als Innovationsökonom befasst er sich mit strukturellen Veränderungen im 
Rahmen der zunehmenden Digitalisierung. Neben Unternehmensgründung und 
-finanzierung liegt sein Interessensschwerpunkt auf den wirtschaftlichen Effekten 
der Digitalisierung der industriellen Produktion (Industrie 4.0) und den damit einher- 
gehenden Auswirkungen, insbesondere auf den Mittelstand. 
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Dr. Jan Wessels 


Jan Wessels ist Politologe und arbeitet seit 2000 bei der VDI/VDE-IT. Seine Schwer- 
punkte liegen in der Evaluation von Forschungs-, Technologie- und Innovationspolitik 
sowie in der strategischen Politikberatung zu Themen der Innovationspolitik, insbe- 
sondere für das BMBF und das BMWi. Jan Wessels ist Sprecher des Arbeitskreises 
Forschungs-, Technologie- und Innovationspolitik der DeGEval - Gesellschaft für Eva- 
luation. 


Dr. Benjamin Wilsch 


Benjamin Wilsch studierte Physik mit dem Schwerpunkt Festkörper-/Halbleiterphysik 
an der Humboldt-Universität zu Berlin sowie an der Freien Universität Berlin. Anschlie- 
Bend promovierte er 2016 an der Universität Grenoble Alpes zum Thema Magnet- 
feldsensorik für intelligente Stromnetze. Seit 2017 ist er wissenschaftlicher Mitarbei- 
ter der VDI/VDE-IT im Bereich Mobilität der Zukunft und Europa. Der Schwerpunkt 
seiner Tätigkeiten liegt beim automatisierten Fahren, mit dem er sich unter anderem 
im Rahmen der Projektträgerschaft „Automatisiertes und vernetztes Fahren” (BMVI) 
sowie des EU-Projekts CARTRE befasst. 


Dr. Steffen Wischmann 


Steffen Wischmann ist seit 2013 bei der VDI/VDE-IT im Bereich „Gesellschaft und 
Innovation” tätig. Dort leitet er derzeit die Gruppe „Datenökonomie und Geschäfts- 
modelle“ und analysiert aktuelle wirtschaftliche, wissenschaftliche und politische 
Entwicklungen in den Bereichen Industrie 4.0, Arbeitssystemgestaltung, Robotik- 
und Automatisierungstechnologien. Er leitet die Begleitforschung zu Technologie- 
programmen des Bundesministeriums für Wirtschaft und Energie und vertritt das iit 
im VDV/VDE-GMA Fachausschuss 7.22 „Arbeitswelt Industrie 4.0”. 


Prof. Dr. Volker Wittpahl 


Volker Wittpahl leitet seit 2016 das iit. Nach dem Studium der Mikroelektronik in 
Deutschland und Singapur sammelte er Industrieerfahrungen in den Bereichen Tech- 
nologie-Marketing sowie Innovationsmanagement von Leistungselektronik für die 
Automobilbranche im Philips-Konzern. Mit seinem Wechsel zu Philips Design nach 
Eindhoven in den Niederlanden wurde er einer der Entwicklungsverantwortlichen im 
konzerneigenen interdisziplinären Think Tank. Dort entwickelte er aus den beobach- 
teten Technologie-, Markt- und sozio-kulturellen Trends neue Produkte, Dienste und 
Geschäftsfelder für interne und externe Industriekunden. Seit 2014 ist Volker Witt- 
pahl Professor an der Universität Klaipeda in Litauen und initiiert deutsch-baltische 
Projekte im Wissenstransfer. 
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Guido Zinke 


Guido Zinke ist Volkswirt und berät, evaluiert und forscht im Auftrag der EU-Kom- 
mission sowie des BMBF und des BMWi zu digital-, innovations- und technologiepo- 
litischen Fragestellungen. Seit 2017 ist er als Seniorberater und Projektleiter in der 
VDI/VDE-IT im Bereich Foresight, Gründungsforschung und digitale Transformation 
tätig. Zuvor arbeitete er als Politikberater für Kienbaum und Rambøll sowie für die 
Landesbank Baden-Württemberg. 
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Abkürzungsverzeichnis 


ASIC Application-specific Integrated Circuit (anwendungsspezifische 
Schaltungen) 


CAD Computer Aided Diagnosis 

CMS Content-Management-System 
CNN Convolutional Neural Networks 
CPU Central Processing Unit (Universal- oder Hauptprozessoren) 
DL Deep Learning (tiefes Lernen) 
FTF Fahrerlose Transportfahrzeuge 
GAN Generative Adversarial Networks 
GPU Grafikprozessoren 

IOT Internet of Things 

KI Künstliche Intelligenz 

KNN Künstliche neuronale Netze 

LMS Learning-Management-System 


MOOC Massive Open Online Course 


ML Machine Learning (maschinelles Lernen) 


NLP Natural Language Processing (Sprachverarbeitung) 


